一种基于微博的热点信息提取的方法和装置
基本信息
申请号 | CN201310177797.8 | 申请日 | - |
公开(公告)号 | CN103324665B | 公开(公告)日 | 2017-05-03 |
申请公布号 | CN103324665B | 申请公布日 | 2017-05-03 |
分类号 | G06F17/30(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 杜毅;罗峰;黄苏支;李娜 | 申请(专利权)人 | 亿赞普(北京)科技有限公司 |
代理机构 | 北京润泽恒知识产权代理有限公司 | 代理人 | 赵娟 |
地址 | 100081 北京市海淀区南大街东北旺北京中关村软件园孵化器1号楼C座三层1322-D | ||
法律状态 | - |
摘要
摘要 | 本发明提供了一种基于微博的热点信息提取的方法和装置,其中所述方法包括:获取微博数据集合;从所述微博数据集合中提取特征信息,所述特征信息包括文本特征、时序特征、社交关系特征;依据所述文本特征、时序特征、社交关系特征聚类成一个或多个话题;提取每个话题的关键事件因子,将基于所述关键事件因子组成热点信息。本发明综合考虑了微博数据的特点,可以提高基于微博的热点信息发现的准确度。 |
