社交网络平台上话题关键词自适应扩充的方法及系统
基本信息
申请号 | CN201310018004.8 | 申请日 | - |
公开(公告)号 | CN103092956B | 公开(公告)日 | 2016-02-10 |
申请公布号 | CN103092956B | 申请公布日 | 2016-02-10 |
分类号 | G06F17/30(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 周异;叶辉;徐勇;周曲;陈凯 | 申请(专利权)人 | 南京霁云信息科技有限公司 |
代理机构 | 上海汉声知识产权代理有限公司 | 代理人 | 郭国中 |
地址 | 200240 上海市闵行区东川路800号 | ||
法律状态 | - |
摘要
摘要 | 本发明公开一种社交网络平台上话题关键词自适应扩充的方法及系统。本发明通过分析社交网络信息内容中词之间的相关性,提取隐含和相关话题的关键词建立关键词扩充词汇库。该方法通过标注少量的关键词建立种子关键词库,增量自反馈收集样本信息建立语料库,通过样本信息获取词频,利用词频和多层过滤算法得到与种子关键词相关性高的相关词语,最后选择合适的词汇加入到关键词扩充库中。本发明区别于传统的网页类关键词扩充机制,这种方法是建立在社交网络信息内容的特点上,对关键词的选择具有更高的灵活性和自适应性。 |
