文本相似度计算方法、装置及计算机设备

基本信息

申请号 CN202111145040.1 申请日 -
公开(公告)号 CN113987117A 公开(公告)日 2022-01-28
申请公布号 CN113987117A 申请公布日 2022-01-28
分类号 G06F16/33(2019.01)I;G06F40/194(2020.01)I;G06K9/62(2022.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I;G06N20/20(2019.01)I 分类 计算;推算;计数;
发明人 王伟;黄勇其;于翠翠;张黔 申请(专利权)人 华润数字科技(西安)有限公司
代理机构 深圳市世联合知识产权代理有限公司 代理人 杨晖琼
地址 710000陕西省西安市高新区天谷八路211号环普科技产业园C座303、304室
法律状态 -

摘要

摘要 本申请实施例属于人工智能和自然语言处理领域,应用于文本处理领域中,涉及一种文本相似度计算方法、装置、计算机设备及存储介质,方法包括获取基于神经网络的M个文本相似度算法模型;提取每个文本相似度算法模型的模型特征;根据所述模型特征,将所述M个文本相似度算法模型进行聚类,得到K个模型簇,其中,K小于或等于M;通过强化学习对每个模型簇进行训练,并利用集成学习对每个文本相似度算法模型进行权重分配,得到综合文本相似度算法模型;通过所述综合文本相似度算法模型对目标文本进行相似度计算。此外,本申请还涉及区块链技术,文本相似度算法模型可存储于区块链中。本申请解决了文本相似度的计算准确率不稳定的问题。