文本相似度最佳阈值自动寻找及优化方法及装置

基本信息

申请号 CN202011374448.1 申请日 -
公开(公告)号 CN112329428A 公开(公告)日 2021-02-05
申请公布号 CN112329428A 申请公布日 2021-02-05
分类号 G06F40/194(2020.01)I; 分类 计算;推算;计数;
发明人 苑晓科;唐正才;田凤占 申请(专利权)人 北京天润融通科技股份有限公司
代理机构 北京方韬法业专利代理事务所(普通合伙) 代理人 党小林
地址 100000北京市大兴区北京经济技术开发区荣华南路2号院1号楼2901
法律状态 -

摘要

摘要 本发明提供了一种文本相似度最佳阈值自动寻找及优化方法及装置。该方法包括:根据问题列表中每个问题的向量表示,计算问题相似度矩阵;遍历问题类别及问题相似度矩阵,得到问题类别平均相似度矩阵;判断是否有类间问题相似度大于类别平均相似度;如果有,则发现存在的配置问题,并重复上述操作,直至不再存在类间问题相似度大于类别平均相似度的情况;当不再存在类间问题相似度大于类别平均相似度的情况时,遍历问题类别平均相似度矩阵,得到最优相似度阈值。本发明提供的文本相似度最佳阈值自动寻找及优化方法及装置能够自动寻找适合该机器人已配置数据集的相似度阈值。