基于深度学习的文本分类方法、装置、服务器及存储介质

基本信息

申请号 CN202011203373.0 申请日 -
公开(公告)号 CN112329836A 公开(公告)日 2021-02-05
申请公布号 CN112329836A 申请公布日 2021-02-05
分类号 G06K9/62(2006.01)I; 分类 计算;推算;计数;
发明人 朱永强;伍文成 申请(专利权)人 成都网安科技发展有限公司
代理机构 成都极刻智慧知识产权代理事务所(普通合伙) 代理人 唐维虎
地址 610000四川省成都市青羊区广富路218号G区6栋C座
法律状态 -

摘要

摘要 本申请实施例提供一种基于深度学习的文本分类方法、装置、服务器及存储介质,通过按照训练语料分句权重对训练语料进行关键分句筛选,得到关键分句筛选后的训练语料构成的训练样本集,从而可以按照语言习惯选择尽可能保留完整语句与原始语序,通过基于分句权重选取关键分句用于后续的文本分类判别训练,可以使得深度学习模型能够学习到正常的语义特征。在此基础上,通过获取训练样本集中不同预设长度分区的分区样本集,并将每个分区样本集分别输入深度学习模型中进行训练,得到不同预设长度分区的文本分类模型,从而采用多长度分区的多模型训练方式,能够对不同文本长度的待分类文本自适应选取深度学习模型进行分类,提高分类精度。