一种用于智能语音交互的文本分类方法

基本信息

申请号 CN201910427808.0 申请日 -
公开(公告)号 CN110188199A 公开(公告)日 2019-08-30
申请公布号 CN110188199A 申请公布日 2019-08-30
分类号 G06F16/35;G06F16/332;G10L15/26 分类 计算;推算;计数;
发明人 王树大;张兆明;安丽娜 申请(专利权)人 北京鸿联九五信息产业有限公司
代理机构 北京思睿峰知识产权代理有限公司 代理人 北京鸿联九五信息产业有限公司
地址 100080 北京市海淀区海淀南路19号第六层6001A
法律状态 -

摘要

摘要 本发明公开了一种用于智能语音交互的文本分类方法,包括:获取具有标签的训练文本集;对每个标签下的训练文本进行分词处理,得到词序列;对词序列进行词频和逆文档频率统计,得到每个词对应的TF‑IDF值;将TF‑IDF值大于预定阈值的词作为该标签下的特征词,以生成每个标签对应的特征词典;基于特征词典对训练文本集进行过滤,以得到训练文本集对应的特征矩阵;以及将特征矩阵输入预训练的文本分类模型中进行训练,以便基于训练后的文本分类模型对语音文本进行分类。该方案能够提高文本分类的效率和准确性,提高智能语音交互的自动化和智能化。