一种公式相似度计算方法和科技文档检索方法及装置
基本信息
申请号 | CN201910510665.X | 申请日 | - |
公开(公告)号 | CN110414319B | 公开(公告)日 | 2021-08-31 |
申请公布号 | CN110414319B | 申请公布日 | 2021-08-31 |
分类号 | G06K9/00;G06F16/332;G06F16/338 | 分类 | 计算;推算;计数; |
发明人 | 韩光;周献民;冯文化;崔永进;兰静;杨杨;田宝松 | 申请(专利权)人 | 中国软件与技术服务股份有限公司 |
代理机构 | 北京君尚知识产权代理有限公司 | 代理人 | 邱晓锋 |
地址 | 100081 北京市海淀区学院南路55号(中软大厦) | ||
法律状态 | - |
摘要
摘要 | 本发明涉及一种基于有效匹配子树的公式相似度计算方法和科技文档检索方法及装置。该公式相似度计算方法包括:1)将数学公式解析为树结构,并从树结构中提取有效子树信息;2)利用提取的有效子树信息,将数学公式表示为有效子树的有序多重集;3)根据有效子树找到有效匹配子树,并计算有效匹配子树的权重加和,得到权重和相似度;4)对权重和相似度进行标准化处理,得到最终的公式相似度。进一步可基于该公式相似度计算方法进行科技文档检索。本发明能够解决现有技术中公式子树不独立而产生的无效匹配问题,能够使公式相似度计算的准确性得到明显提升。 |
