一种动态舆情关键词抽取系统和方法

基本信息

申请号 CN201210586409.7 申请日 -
公开(公告)号 CN103186662A 公开(公告)日 2013-07-03
申请公布号 CN103186662A 申请公布日 2013-07-03
分类号 G06F17/30(2006.01)I 分类 计算;推算;计数;
发明人 赵树合;杨小豹;巩在飞 申请(专利权)人 北京中油网资讯技术有限公司
代理机构 北京元中知识产权代理有限责任公司 代理人 中联竞成(北京)科技有限公司;北京中油网资讯技术有限公司
地址 100085 北京市海淀区中关村软件园国际软件大厦9号楼2区B102室
法律状态 -

摘要

摘要 本发明公开了一种动态舆情关键词抽取系统及方法,包括抽取模块,映射模块,分词空间K3,计算模块,标记模块,抽取模块以用户输入的关键词进行目标信息的样本抽取,映射模块将抽取目标信息的文本信息映射到分词空间K3中进行分词处理,计算模块将分词处理后的中文词汇表达为向量,根据中文词汇的权重系数以及词频对中文词汇进行权重指数的计算,选取出标签关键词传送至标记模块,进行信息的标签关键词标记,并生成一索引文件,能够快速准确的生成标签关键词,进行目标信息的统计和标记,并生成方便用户查询的索引文件,用户可以进行后续信息的查询,只需要输入标签关键词便能够进行目标信息的快速查询。