一种信息获取方法和系统、设备及存储介质

基本信息

申请号 CN201910762979.9 申请日 -
公开(公告)号 CN110851562A 公开(公告)日 2020-02-28
申请公布号 CN110851562A 申请公布日 2020-02-28
分类号 G06F16/33;G06F16/335;G06F40/216;G06F40/289;G06K9/62 分类 计算;推算;计数;
发明人 徐艺 申请(专利权)人 湖南正宇软件技术开发有限公司
代理机构 长沙智德知识产权代理事务所(普通合伙) 代理人 湖南正宇软件技术开发有限公司
地址 410000 湖南省长沙市高新开发区尖山路39号长沙中电软件园一期5栋701
法律状态 -

摘要

摘要 本发明公开了一种信息获取方法和系统、设备及存储介质,属于信息技术领域。数据采集模块、中文分词模块、中文名词打分模块、热点提取模块、内容推荐模块和相似度文档推荐模块,其中,数据采集模块,用于定向抓取数据对象的文档内容,并发送给热点提取模块;中文分词模块,用于提取数据对象的文档内容中的中文名称;中文名词打分模块,用于筛选数据对象的文档内容中的关键词;热点提取模块,用于对数据对象的文档内容关键词评分后提取涉及到的热点;内容推荐模块,用于推荐与数据对象关联的内容;相似度分析模块,用于计算数据对象的文档内容之间的相似性。通过采集数据对象的文档内容信息,提取关键字、热点及其之间的关联性,有选择的推荐文档内容给用户,避免信息冗余。