基于结构文本聚类的专利地形图绘制方法及装置
基本信息
申请号 | CN202111025719.7 | 申请日 | - |
公开(公告)号 | CN113886574A | 公开(公告)日 | 2022-01-04 |
申请公布号 | CN113886574A | 申请公布日 | 2022-01-04 |
分类号 | G06F16/35(2019.01)I;G06F40/289(2020.01)I | 分类 | 计算;推算;计数; |
发明人 | 朱欣昱;程序;刘琦;孔文娟;李艳;陈亚鑫;张素兰 | 申请(专利权)人 | 北京中知智慧科技有限公司 |
代理机构 | 北京三友知识产权代理有限公司 | 代理人 | 侯天印;郝博 |
地址 | 100088北京市海淀区马甸南村一号9幢202号 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种基于结构文本聚类的专利地形图绘制方法及装置,其中该方法包括:获取所有目标专利文本;按照不同类型字段及每一类型字段对应的预设权重,从每一所述目标专利文本中提取关键特征词;确定每一关键特征词在所在专利文本中的文档内权重;确定每一关键特征词在所有专利文本中的文档间权重;根据所述文档内权重和文档间权重,确定加入到聚类集合中的关键特征词;根据加入到聚类集合中的关键特征词,对目标专利文本进行聚类处理,得到聚类处理结果;根据所述聚类处理结果,绘制专利地形图。本发明可以实现基于结构文本聚类精确地绘制专利地形图,从而可以准确地反映专利技术的技术关联程度和技术密集点等信息。 |
