事件聚类文本检索系统
基本信息
申请号 | CN202210001964.2 | 申请日 | - |
公开(公告)号 | CN114398534A | 公开(公告)日 | 2022-04-26 |
申请公布号 | CN114398534A | 申请公布日 | 2022-04-26 |
分类号 | G06F16/951(2019.01)I;G06F16/35(2019.01)I;G06F16/338(2019.01)I;G06F40/289(2020.01)I;G06K9/62(2022.01)I | 分类 | 计算;推算;计数; |
发明人 | 刘彬;王玉娟;王锐;王震;倪晔玮 | 申请(专利权)人 | 上海邮电设计咨询研究院有限公司 |
代理机构 | 上海骁象知识产权代理有限公司 | 代理人 | 赵峰 |
地址 | 200092上海市杨浦区国康路38号3号楼 | ||
法律状态 | - |
摘要
摘要 | 本发明提供了一种事件聚类文本检索系统,包括:处理器、存储有计算机程序的存储器、爬取数据库和显示界面。爬取数据库中存储有对事件文本进行分词处理得到的事件文本向量和对应的事件分词权重,以及对与事件文本相关的关联文本进行分词处理得到的关联文本向量和对应的关联分词权重。处理器用于基于不同的相似度计算公式来计算任一事件文本向量和对应的关联文本向量之间的相似度,并将对应的关联文本按照相似度降序的方式呈现在显示界面上。本发明能够提升获取效率和文本针对性。 |
