一种信息获取方法和系统、设备及存储介质
基本信息
申请号 | CN201910762979.9 | 申请日 | - |
公开(公告)号 | CN110851562A | 公开(公告)日 | 2020-02-28 |
申请公布号 | CN110851562A | 申请公布日 | 2020-02-28 |
分类号 | G06F16/33;G06F16/335;G06F40/216;G06F40/289;G06K9/62 | 分类 | 计算;推算;计数; |
发明人 | 徐艺 | 申请(专利权)人 | 湖南正宇软件技术开发有限公司 |
代理机构 | 长沙智德知识产权代理事务所(普通合伙) | 代理人 | 湖南正宇软件技术开发有限公司 |
地址 | 410000 湖南省长沙市高新开发区尖山路39号长沙中电软件园一期5栋701 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种信息获取方法和系统、设备及存储介质,属于信息技术领域。数据采集模块、中文分词模块、中文名词打分模块、热点提取模块、内容推荐模块和相似度文档推荐模块,其中,数据采集模块,用于定向抓取数据对象的文档内容,并发送给热点提取模块;中文分词模块,用于提取数据对象的文档内容中的中文名称;中文名词打分模块,用于筛选数据对象的文档内容中的关键词;热点提取模块,用于对数据对象的文档内容关键词评分后提取涉及到的热点;内容推荐模块,用于推荐与数据对象关联的内容;相似度分析模块,用于计算数据对象的文档内容之间的相似性。通过采集数据对象的文档内容信息,提取关键字、热点及其之间的关联性,有选择的推荐文档内容给用户,避免信息冗余。 |
