基于深层神经网络的婴儿啼哭声识别方法及系统
基本信息
申请号 | CN201310347807.8 | 申请日 | - |
公开(公告)号 | CN104347066B | 公开(公告)日 | 2019-11-12 |
申请公布号 | CN104347066B | 申请公布日 | 2019-11-12 |
分类号 | G10L15/06(2013.01)I; G10L15/16(2006.01)I; G10L25/24(2013.01)I | 分类 | 乐器;声学; |
发明人 | 景亚鹏; 张峰; 吴义坚 | 申请(专利权)人 | 盛乐信息技术(上海)有限公司 |
代理机构 | 北京辰权知识产权代理有限公司 | 代理人 | 上海掌门科技有限公司 |
地址 | 201203 上海市浦东新区张衡路666弄1号7楼 | ||
法律状态 | - |
摘要
摘要 | 本发明提供了一种基于深层神经网络的婴儿啼哭声识别方法及系统,所述方法包括采集训练用婴儿啼哭声数据;对所述训练用婴儿啼哭声数据进行分类标注;提取每一个分类标注的训练用婴儿啼哭声数据中每段音频的梅尔域倒谱系数以生成训练用数据文件;根据所述训练用数据文件并采用逐层预训练的方式得到深层神经网络中每一层的初始权值;根据深层神经网络中所有层的初始权值并采用BP算法获取所述深层神经网络的哭声模型;采集待识别的婴儿啼哭声数据,提取待识别的婴儿啼哭声数据中每段音频的梅尔域倒谱系数;根据待识别的婴儿啼哭声数据中每段音频的梅尔域倒谱系数和所述哭声模型进行哭声识别,能够提高对婴儿啼哭声的识别率。 |
