技术文档溯源方法及装置、计算机设备、计算机存储介质

基本信息

申请号 CN202011337966.6 申请日 -
公开(公告)号 CN112487160A 公开(公告)日 2021-03-12
申请公布号 CN112487160A 申请公布日 2021-03-12
分类号 G06F16/35(2019.01)I;G06F16/332(2019.01)I;G06F16/33(2019.01)I 分类 计算;推算;计数;
发明人 殷达;谭咏霖;丁铭;唐杰;刘德兵;仇瑜 申请(专利权)人 北京智谱华章科技有限公司
代理机构 北京辰权知识产权代理有限公司 代理人 刘广达
地址 100084 北京市海淀区中关村东路1号院6号楼6层603A
法律状态 -

摘要

摘要 本发明能够提供技术文档溯源方法及装置、计算机设备、计算机存储介质。技术文档溯源方法可包括:基于目标技术文档查找存在关联关系的多个参考技术文档。创建各技术文档的特征向量,特征向量用于表征技术文档的文本特征和不同技术文档之间的关联特征。基于特征向量对参考技术文档进行聚类处理,以形成多个文档集合。对于每个文档集合,根据时间关系排列参考技术文档构成溯源路线。生成用于表征目标技术文档溯源结果的树形图。本发明能为技术文档进行溯源分析,挖掘出技术文档之间的影响关系和有用信息,并快速生成表征目标技术文档溯源结果的溯源树,生动刻画技术或思想的演变过程,以满足科研人员等用户定位到真正需要深入阅读的内容的需求。