文本分类方法、装置、计算机设备和存储介质

基本信息

申请号 CN201810283100.8 申请日 -
公开(公告)号 CN108509596B 公开(公告)日 2021-06-04
申请公布号 CN108509596B 申请公布日 2021-06-04
分类号 G06F16/35;G06N3/04;G06N3/08 分类 计算;推算;计数;
发明人 朱汝维;游永明 申请(专利权)人 广州市申迪计算机系统有限公司
代理机构 广州华进联合专利商标代理有限公司 代理人 黄晓庆
地址 510600 广东省广州市越秀区中山一路金羊一街2号1楼
法律状态 -

摘要

摘要 本申请涉及一种文本分类方法、装置、计算机设备和存储介质。方法包括:获取待分类文本;将所述待分类文本输入对训练文本进行训练得到的分类模型,获得所述待分类文本的分类结果。对训练文本进行训练得到的分类模型的步骤包括:将训练文本中标注文本输入预设分类模型,进行监督对抗训练,并将训练文本中无标注文本输入监督对抗训练后的所述预设分类模型,进行无监督虚拟对抗训练,获得分类模型。分类模型的无监督虚拟对抗过程中可以利用了大量的无标注的数据作为输入来进行虚拟对抗训练,而不需要全部使用标注数据来充当预设分类模型训练,可以提高训练过程中输入的数据量,且大大减轻对人工标注数据量的需求,降低分类模型建立的人力成本。