一种用于基于地域和行业进行热点事件挖掘的方法和设备
基本信息
申请号 | CN201310693571.3 | 申请日 | - |
公开(公告)号 | CN103714132B | 公开(公告)日 | 2017-12-26 |
申请公布号 | CN103714132B | 申请公布日 | 2017-12-26 |
分类号 | G06F17/30(2006.01)I;G06F17/27(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 刘雪平 | 申请(专利权)人 | 北京本果信息技术有限公司 |
代理机构 | 北京英创嘉友知识产权代理事务所(普通合伙) | 代理人 | 北京本果信息技术有限公司 |
地址 | 100083 北京市海淀区学清路38号金码大厦B座20层顶一号房 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种用于基于地域和行业进行热点事件挖掘的方法和设备。该方法包括:从网络获取文档;对每篇文档进行分词处理,并确定每篇文档中各分词的权重;根据所述权重确定每篇文档的关键词;对每篇文档的内容进行地域和行业划分;对内容属于同一地域同一行业的各篇文档的关键词进行关联,形成关键词组,并确定每个关键词组的权重;以及按照所述关键词组的权重确定该地域该行业下的热点事件。由于是针对特定地域和特定行业进行挖掘,因此可根据用户请求,向用户提供其所关心的地域行业下的热点事件。并且,还可以减少挖掘时间,降低计算量,节省系统资源。 |
