文本相似度计算方法、装置及计算机设备
基本信息
申请号 | CN202111145040.1 | 申请日 | - |
公开(公告)号 | CN113987117A | 公开(公告)日 | 2022-01-28 |
申请公布号 | CN113987117A | 申请公布日 | 2022-01-28 |
分类号 | G06F16/33(2019.01)I;G06F40/194(2020.01)I;G06K9/62(2022.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I;G06N20/20(2019.01)I | 分类 | 计算;推算;计数; |
发明人 | 王伟;黄勇其;于翠翠;张黔 | 申请(专利权)人 | 华润数字科技(西安)有限公司 |
代理机构 | 深圳市世联合知识产权代理有限公司 | 代理人 | 杨晖琼 |
地址 | 710000陕西省西安市高新区天谷八路211号环普科技产业园C座303、304室 | ||
法律状态 | - |
摘要
摘要 | 本申请实施例属于人工智能和自然语言处理领域,应用于文本处理领域中,涉及一种文本相似度计算方法、装置、计算机设备及存储介质,方法包括获取基于神经网络的M个文本相似度算法模型;提取每个文本相似度算法模型的模型特征;根据所述模型特征,将所述M个文本相似度算法模型进行聚类,得到K个模型簇,其中,K小于或等于M;通过强化学习对每个模型簇进行训练,并利用集成学习对每个文本相似度算法模型进行权重分配,得到综合文本相似度算法模型;通过所述综合文本相似度算法模型对目标文本进行相似度计算。此外,本申请还涉及区块链技术,文本相似度算法模型可存储于区块链中。本申请解决了文本相似度的计算准确率不稳定的问题。 |
