一种动态舆情关键词抽取系统和方法
基本信息
申请号 | CN201210586409.7 | 申请日 | - |
公开(公告)号 | CN103186662B | 公开(公告)日 | 2016-08-03 |
申请公布号 | CN103186662B | 申请公布日 | 2016-08-03 |
分类号 | G06F17/30(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 杨小豹;赵树合 | 申请(专利权)人 | 北京中油网资讯技术有限公司 |
代理机构 | 北京元中知识产权代理有限责任公司 | 代理人 | 北京中油网资讯技术有限公司 |
地址 | 100011 北京市朝阳区安华里二区甲3号中国石油报社院内1号楼607 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种动态舆情关键词抽取系统及方法,包括抽取模块,映射模块,分词空间K3,计算模块,标记模块,抽取模块以用户输入的关键词进行目标信息的样本抽取,映射模块将抽取目标信息的文本信息映射到分词空间K3中进行分词处理,计算模块将分词处理后的中文词汇表达为向量,根据中文词汇的权重系数以及词频对中文词汇进行权重指数的计算,选取出标签关键词传送至标记模块,进行信息的标签关键词标记,并生成一索引文件,能够快速准确的生成标签关键词,进行目标信息的统计和标记,并生成方便用户查询的索引文件,用户可以进行后续信息的查询,只需要输入标签关键词便能够进行目标信息的快速查询。 |
