可定制的低延时命令词识别方法及装置

基本信息

申请号 CN202110865579.8 申请日 -
公开(公告)号 CN113593560A 公开(公告)日 2021-11-02
申请公布号 CN113593560A 申请公布日 2021-11-02
分类号 G10L15/22(2006.01)I;G10L15/16(2006.01)I;G10L15/06(2013.01)I;G10L15/02(2006.01)I 分类 乐器;声学;
发明人 司玉景;李全忠;何国涛;蒲瑶 申请(专利权)人 普强时代(珠海横琴)信息技术有限公司
代理机构 北京科亿知识产权代理事务所(普通合伙) 代理人 汤牡丹
地址 519000广东省珠海市横琴新区宝华路6号105室-58115(集中办公区)
法律状态 -

摘要

摘要 本发明涉及一种可定制的低延时命令词识别方法及装置,包括获取待识别语音,并根据待识别语音确定待处理的声学特征;将声学特征输入到预构建的神经网络分类模型中进行识别,获取声学特征所属的每个建模单元的后验概率;其中,建模单元为带调拼音;根据后验概率计算每个命令词的置信度以及其包含的建模单元出现的时间点;根据置信度和时间点来判断是否输出该命令词。本发明能够对汉语中所有的带调拼音进行建模,采用简单高效的打分机制,完成低延时命令词列表的识别任务,降低了命令词识别的开发成本和时间成本。本发明采用的置信度计算方法具有极低的计算复杂度和空间复杂度,并具有较高的准确率和较低的误唤醒率,可实时地检测命令词是否出现。