一种关键信息与上市公司公告文本语义匹配方法及装置

基本信息

申请号 CN202111571558.1 申请日 -
公开(公告)号 CN113961674A 公开(公告)日 2022-01-21
申请公布号 CN113961674A 申请公布日 2022-01-21
分类号 G06F16/33(2019.01)I;G06F16/335(2019.01)I;G06F16/31(2019.01)I;G06F40/289(2020.01)I;G06F40/30(2020.01)I;G06N3/08(2006.01)I 分类 计算;推算;计数;
发明人 胡为民;郑喜 申请(专利权)人 深圳市迪博企业风险管理技术有限公司
代理机构 北京惟盛达知识产权代理事务所(普通合伙) 代理人 董鸿柏
地址 518000广东省深圳市福田区深南大道1006号国际创新中心A栋6楼西
法律状态 -

摘要

摘要 本发明公开了一种关键信息与上市公司公告文本语义匹配方法及装置,方法包括:构建马尔科夫链矩阵;根据马尔科夫链矩阵,提取候选词语,构建关键信息候选词语集;筛选关键信息;根据最终关键信息和字段信息,得到最终关键信息向量表征和字段信息向量表征;对最终关键信息向量表征进行迁移学习,得到新生成的最终关键信息向量表征;最终关键信息与字段信息对齐,得到与最终关键信息语义匹配的上市公司公告文本;装置包括关键信息提取模块、以及关键信息与字段对齐模块;本发明提供的这种方法及装置适用于类型众多的上市公司公告文档的关键信息提取,且能够将关键信息与字段信息进行对齐,进而得到与关键信息语义匹配的上市公司公告文本。