一种基于circle loss的文本相似度匹配方法、装置、计算机设备和储存介质

基本信息

申请号 CN202110417707.2 申请日 -
公开(公告)号 CN113221530A 公开(公告)日 2021-08-06
申请公布号 CN113221530A 申请公布日 2021-08-06
分类号 G06F40/194;G06F16/332;G06K9/62 分类 计算;推算;计数;
发明人 刘伟;杨红飞 申请(专利权)人 杭州火石数智科技有限公司
代理机构 宁波鄞州全方专利商标事务所(普通合伙) 代理人 楼瑜舟
地址 310000 浙江省杭州市滨江区西兴街道物联网街369号A幢9层905室
法律状态 -

摘要

摘要 本发明公开了一种基于circle loss的文本相似度匹配方法、装置、计算机设备和储存介质,其涉及计算机信息处理技术领域,所述方法包括:S1样本准备;S2模型训练;S3模型预测;在S2模型训练阶段,首先使用孪生网络结构分批训练上述样本集;然后分别计算锚样本与正样本、负样本之间的距离:利用electra模型计算样本的3)使用circle loss损失函数计算损失值,接着利用electra模型计算每个样本的特征表示,将circle loss损失函数与electra模型相结合,并使其应用到问答系统中,可得到文本相似度匹配速度与精度均较高的问题收集方法。