一种以矩阵计算为基础进行舆论信息抽取的方法及系统
基本信息
申请号 | CN201510569894.0 | 申请日 | - |
公开(公告)号 | CN105117385A | 公开(公告)日 | 2015-12-02 |
申请公布号 | CN105117385A | 申请公布日 | 2015-12-02 |
分类号 | G06F17/27(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 杜登斌;杜璞 | 申请(专利权)人 | 北京中润普达信息技术有限公司 |
代理机构 | 北京律诚同业知识产权代理有限公司 | 代理人 | 北京中润普达信息技术有限公司 |
地址 | 100029 北京市西城区北三环中路甲29号华尊大厦605 | ||
法律状态 | - |
摘要
摘要 | 本发明提出一种以矩阵计算为基础进行舆论信息抽取的方法及系统,该方法包括:抓取互联网的网站信息,建立信息源矩阵,其中信息源矩阵包括信息库类型信息、信息库信息、站点信息、子站点信息、信息源统计信息、信息库权限信息、基础属性信息、文章字段信息八部分;建立分词矩阵、规则矩阵,分别获取所述信息源矩阵与所述分词矩阵与所述规则矩阵的权重与候选级别,用户输入用户关键词,通过分词矩阵选择所述用户关键词的所属行业,根据所述权重与所述候选级别计算综合评分,以完成舆情分析。本发明无需建立情感词库,实时多维度抓取数据,建立信息源矩阵、分词矩阵、规则矩阵,三个矩阵进行关联达到动态平衡,精确查找用户查询的词,准确率95%以上。 |
