一种文本分类方法及装置
基本信息
申请号 | CN202111386639.4 | 申请日 | - |
公开(公告)号 | CN114048290A | 公开(公告)日 | 2022-02-15 |
申请公布号 | CN114048290A | 申请公布日 | 2022-02-15 |
分类号 | G06F16/33(2019.01)I;G06F16/35(2019.01)I;G06F40/194(2020.01)I;G06F40/30(2020.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 胡加明;李健铨;刘小康 | 申请(专利权)人 | 鼎富智能科技有限公司 |
代理机构 | 北京弘权知识产权代理有限公司 | 代理人 | 郭放;许伟群 |
地址 | 230000安徽省合肥市高新区习友路3333号A1楼19层-B区 | ||
法律状态 | - |
摘要
摘要 | 本申请实施例提供了一种文本分类方法及装置。其中,该方法包括:获取文本的文本表示向量与标签矩阵之间的相似度向量;获取从相似度向量到文本对应的标签之间的第一损失函数;对文本表示向量进行线性映射,得到文本的对抗向量;获取从对抗向量到文本对应的标签之间的第二损失函数;将第一损失函数和第二损失函数的结合作为文本分类模型的总损失函数,以训练文本分类模型;根据训练后的文本分类模型对未知文本进行分类。本申请实施例的技术方案,通过引入对抗训练使文本分类模型不再专注于学习某个类别的简单特征,而是学习到各个类别的共性特征,使文本分类模型学习到类别更深层次的表示,提高了文本分类模型的泛化性和鲁棒性。 |
