一种摘要抽取方法

基本信息

申请号 CN202111532196.5 申请日 -
公开(公告)号 CN113918708B 公开(公告)日 2022-03-22
申请公布号 CN113918708B 申请公布日 2022-03-22
分类号 G06F16/34(2019.01)I;G06F16/36(2019.01)I;G06F40/30(2020.01)I;G06N3/04(2006.01)I;G06K9/62(2022.01)I 分类 计算;推算;计数;
发明人 胡为民;郑喜 申请(专利权)人 深圳市迪博企业风险管理技术有限公司
代理机构 北京惟盛达知识产权代理事务所(普通合伙) 代理人 陈钊
地址 518000广东省深圳市福田区深南大道1006号国际创新中心A栋6楼西
法律状态 -

摘要

摘要 本发明涉及自然语言处理技术领域,具体涉及一种摘要抽取方法,包括如下步骤:S1、预处理,将公告文本中的数值、时间类型数据进行泛化处理;S2、构建第一词表;S3、构建第一词表的词语共现矩阵;S4、词语共现矩阵降维,提取第一词表内所有词语的语义表征;S5、重复S2至S4,提取公告文本中所有词语的语义表征;S6、以语句为单位,将语义表征进行累加合并,形成语句上下文语义表征;S7、用户输入关键词组,提取关键词组语义表征;S8、判断关键词组语义表征与语句上下文语义表征的相似度,关键词组的相似度大于设定值,则将包括该关键词组的公告文本语句抽取为公共文本摘要。抽取摘要的内容与用户输入关键词的关联度高。