一种摘要抽取方法
基本信息
申请号 | CN202111532196.5 | 申请日 | - |
公开(公告)号 | CN113918708B | 公开(公告)日 | 2022-03-22 |
申请公布号 | CN113918708B | 申请公布日 | 2022-03-22 |
分类号 | G06F16/34(2019.01)I;G06F16/36(2019.01)I;G06F40/30(2020.01)I;G06N3/04(2006.01)I;G06K9/62(2022.01)I | 分类 | 计算;推算;计数; |
发明人 | 胡为民;郑喜 | 申请(专利权)人 | 深圳市迪博企业风险管理技术有限公司 |
代理机构 | 北京惟盛达知识产权代理事务所(普通合伙) | 代理人 | 陈钊 |
地址 | 518000广东省深圳市福田区深南大道1006号国际创新中心A栋6楼西 | ||
法律状态 | - |
摘要
摘要 | 本发明涉及自然语言处理技术领域,具体涉及一种摘要抽取方法,包括如下步骤:S1、预处理,将公告文本中的数值、时间类型数据进行泛化处理;S2、构建第一词表;S3、构建第一词表的词语共现矩阵;S4、词语共现矩阵降维,提取第一词表内所有词语的语义表征;S5、重复S2至S4,提取公告文本中所有词语的语义表征;S6、以语句为单位,将语义表征进行累加合并,形成语句上下文语义表征;S7、用户输入关键词组,提取关键词组语义表征;S8、判断关键词组语义表征与语句上下文语义表征的相似度,关键词组的相似度大于设定值,则将包括该关键词组的公告文本语句抽取为公共文本摘要。抽取摘要的内容与用户输入关键词的关联度高。 |
