一种基于circle loss的文本相似度匹配方法、装置、计算机设备和储存介质
基本信息
申请号 | CN202110417707.2 | 申请日 | - |
公开(公告)号 | CN113221530A | 公开(公告)日 | 2021-08-06 |
申请公布号 | CN113221530A | 申请公布日 | 2021-08-06 |
分类号 | G06F40/194;G06F16/332;G06K9/62 | 分类 | 计算;推算;计数; |
发明人 | 刘伟;杨红飞 | 申请(专利权)人 | 杭州火石数智科技有限公司 |
代理机构 | 宁波鄞州全方专利商标事务所(普通合伙) | 代理人 | 楼瑜舟 |
地址 | 310000 浙江省杭州市滨江区西兴街道物联网街369号A幢9层905室 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种基于circle loss的文本相似度匹配方法、装置、计算机设备和储存介质,其涉及计算机信息处理技术领域,所述方法包括:S1样本准备;S2模型训练;S3模型预测;在S2模型训练阶段,首先使用孪生网络结构分批训练上述样本集;然后分别计算锚样本与正样本、负样本之间的距离:利用electra模型计算样本的3)使用circle loss损失函数计算损失值,接着利用electra模型计算每个样本的特征表示,将circle loss损失函数与electra模型相结合,并使其应用到问答系统中,可得到文本相似度匹配速度与精度均较高的问题收集方法。 |
