基于结构文本聚类的专利地形图绘制方法及装置

基本信息

申请号 CN202111025719.7 申请日 -
公开(公告)号 CN113886574A 公开(公告)日 2022-01-04
申请公布号 CN113886574A 申请公布日 2022-01-04
分类号 G06F16/35(2019.01)I;G06F40/289(2020.01)I 分类 计算;推算;计数;
发明人 朱欣昱;程序;刘琦;孔文娟;李艳;陈亚鑫;张素兰 申请(专利权)人 北京中知智慧科技有限公司
代理机构 北京三友知识产权代理有限公司 代理人 侯天印;郝博
地址 100088北京市海淀区马甸南村一号9幢202号
法律状态 -

摘要

摘要 本发明公开了一种基于结构文本聚类的专利地形图绘制方法及装置,其中该方法包括:获取所有目标专利文本;按照不同类型字段及每一类型字段对应的预设权重,从每一所述目标专利文本中提取关键特征词;确定每一关键特征词在所在专利文本中的文档内权重;确定每一关键特征词在所有专利文本中的文档间权重;根据所述文档内权重和文档间权重,确定加入到聚类集合中的关键特征词;根据加入到聚类集合中的关键特征词,对目标专利文本进行聚类处理,得到聚类处理结果;根据所述聚类处理结果,绘制专利地形图。本发明可以实现基于结构文本聚类精确地绘制专利地形图,从而可以准确地反映专利技术的技术关联程度和技术密集点等信息。