文本意图分类的方法、装置和可读介质

基本信息

申请号 CN202110265003.8 申请日 -
公开(公告)号 CN112905795A 公开(公告)日 2021-06-04
申请公布号 CN112905795A 申请公布日 2021-06-04
分类号 G06F16/35;G06F40/295;G06N3/04;G06N3/08 分类 计算;推算;计数;
发明人 陶民泽 申请(专利权)人 证通股份有限公司
代理机构 中国专利代理(香港)有限公司 代理人 李湘;姜冰
地址 200127 上海市浦东新区锦康路308号陆家嘴世纪金融广场6号楼
法律状态 -

摘要

摘要 本发明涉及自然语言处理,特别涉及用于文本意图的分类。按照本发明一个方面的用于生成文本意图分类器的方法包含下列步骤:获得训练数据集,训练数据集包含多个文本样本,每个文本样本包含一个或多个句子;利用训练数据集对第一神经网络模型进行预训练以改善第一神经网络模型与关联于训练数据集的应用领域之间的适配性,其中,第一神经网络模型配置为对文本样本中的句子进行语义分类以得到该文本样本的特征向量;由经过预训练的第一神经网络模型生成第二神经网络模型,其中,第二神经网络模型的层数少于经过预训练的第一神经网络模型的层数;以及将第二神经网络模型连接到输出层以生成文本意图分类器。