一种用于智能语音交互的文本分类方法
基本信息
申请号 | CN201910427808.0 | 申请日 | - |
公开(公告)号 | CN110188199A | 公开(公告)日 | 2019-08-30 |
申请公布号 | CN110188199A | 申请公布日 | 2019-08-30 |
分类号 | G06F16/35;G06F16/332;G10L15/26 | 分类 | 计算;推算;计数; |
发明人 | 王树大;张兆明;安丽娜 | 申请(专利权)人 | 北京鸿联九五信息产业有限公司 |
代理机构 | 北京思睿峰知识产权代理有限公司 | 代理人 | 北京鸿联九五信息产业有限公司 |
地址 | 100080 北京市海淀区海淀南路19号第六层6001A | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种用于智能语音交互的文本分类方法,包括:获取具有标签的训练文本集;对每个标签下的训练文本进行分词处理,得到词序列;对词序列进行词频和逆文档频率统计,得到每个词对应的TF‑IDF值;将TF‑IDF值大于预定阈值的词作为该标签下的特征词,以生成每个标签对应的特征词典;基于特征词典对训练文本集进行过滤,以得到训练文本集对应的特征矩阵;以及将特征矩阵输入预训练的文本分类模型中进行训练,以便基于训练后的文本分类模型对语音文本进行分类。该方案能够提高文本分类的效率和准确性,提高智能语音交互的自动化和智能化。 |
