一种动态舆情关键词抽取系统和方法
基本信息
申请号 | CN201210586409.7 | 申请日 | - |
公开(公告)号 | CN103186662A | 公开(公告)日 | 2013-07-03 |
申请公布号 | CN103186662A | 申请公布日 | 2013-07-03 |
分类号 | G06F17/30(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 赵树合;杨小豹;巩在飞 | 申请(专利权)人 | 北京中油网资讯技术有限公司 |
代理机构 | 北京元中知识产权代理有限责任公司 | 代理人 | 中联竞成(北京)科技有限公司;北京中油网资讯技术有限公司 |
地址 | 100085 北京市海淀区中关村软件园国际软件大厦9号楼2区B102室 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种动态舆情关键词抽取系统及方法,包括抽取模块,映射模块,分词空间K3,计算模块,标记模块,抽取模块以用户输入的关键词进行目标信息的样本抽取,映射模块将抽取目标信息的文本信息映射到分词空间K3中进行分词处理,计算模块将分词处理后的中文词汇表达为向量,根据中文词汇的权重系数以及词频对中文词汇进行权重指数的计算,选取出标签关键词传送至标记模块,进行信息的标签关键词标记,并生成一索引文件,能够快速准确的生成标签关键词,进行目标信息的统计和标记,并生成方便用户查询的索引文件,用户可以进行后续信息的查询,只需要输入标签关键词便能够进行目标信息的快速查询。 |
