一种文本分类方法、装置、电子设备及存储介质

基本信息

申请号 CN202010641209.1 申请日 -
公开(公告)号 CN113901203A 公开(公告)日 2022-01-07
申请公布号 CN113901203A 申请公布日 2022-01-07
分类号 G06F16/35(2019.01)I 分类 计算;推算;计数;
发明人 王永杰 申请(专利权)人 上海流利说信息技术有限公司
代理机构 北京信远达知识产权代理有限公司 代理人 李兆轩
地址 200090上海市杨浦区长阳路1687号西1168幢(C楼)一层C2101室
法律状态 -

摘要

摘要 本申请公开了一种文本分类方法,所述文本分类方法包括确定训练集中训练样本的特征对比信息和相似度标签;根据所述相似度标签构建每一训练样本对应的样本列表;调整排序模型的参数并利用所述排序模型根据每一所述训练样本的特征对比信息计算每一样本分组内基准样本和分组内其他训练样本的文本特征相似度得分,以使所述训练样本的文本特征相似度得分排序序列与所述样本列表的NDCG指标大于预设值;利用所述排序模型确定每一索引文本与待分类文本的相似度,并根据相似度排名前K位的索引文本的文本等级确定所述待分类文本的文本类别。本申请能够提高文本分类的准确率。本申请还公开了一种文本分类装置、一种存储介质及一种电子设备,具有以上有益效果。