一种热点主题挖掘方法和系统

基本信息

申请号 CN201910762850.8 申请日 -
公开(公告)号 CN110852085A 公开(公告)日 2020-02-28
申请公布号 CN110852085A 申请公布日 2020-02-28
分类号 G06F40/284 分类 计算;推算;计数;
发明人 刘跃华 申请(专利权)人 湖南正宇软件技术开发有限公司
代理机构 长沙智德知识产权代理事务所(普通合伙) 代理人 湖南正宇软件技术开发有限公司
地址 410000 湖南省长沙市高新开发区尖山路39号长沙中电软件园一期5栋701
法律状态 -

摘要

摘要 本发明公开了一种热点主题挖掘方法和系统,属于信息技术领域。系统包括主题数据库模块、关键词数据库模块、中文分词模块、中文名词打分模块、相似度分析模块和综合评分模块。方法为数据对象的使用用户审查数据对象,系统选择中文分词模块对数据对象内容进行中文分词,主题数据库和关键词数据库,得到该数据对象所属的主题和关键词;同时,相似度分析模块通过数据对象数据库计算数据对象之间的内容相似度,综合评分后,返回可合并的数据对象列表。本发明通过对数据对象内容、主题和关键词的判断,迅速提取内容相关度比较高的数据对象给用户参考,效率与准确率均有大幅提升。