基于改进Adaboost算法的句子相似性判断方法专利查询专利号|摘要-满商公司网

基于改进Adaboost算法的句子相似性判断方法

基本信息

摘要

摘要	本发明公开了一种基于改进Adaboost算法的句子相似性判断方法，利用预训练语言模型在学习大规模文本的语义知识方面的优势以及Adaboost算法在集成多个基学习器方面的优势，先通过公开语料集中的训练数据对多个不同的预训练语言模型进行独立训练和微调，目的是利用不同预训练语言中的先验知识和网络结构学习文本语义相似性的任务相关知识；接着，在Adaboost R2算法的基础上提出改进的Adaboost算法，并结合验证数据集计算各个模型的权重系数，并进行归一化。最后，根据权重系数将各个模型在测试数据集的预测结果进行线性求和，从而得到最终的句子相似性结果。