真实场景下的婴儿哭声检测方法、装置及可读介质
基本信息
申请号 | CN202111042258.4 | 申请日 | - |
公开(公告)号 | CN113488077A | 公开(公告)日 | 2021-10-08 |
申请公布号 | CN113488077A | 申请公布日 | 2021-10-08 |
分类号 | G10L25/63(2013.01)I;G10L25/30(2013.01)I;G06K9/62(2006.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I | 分类 | 乐器;声学; |
发明人 | 不公告发明人 | 申请(专利权)人 | 珠海亿智电子科技有限公司 |
代理机构 | 广州嘉权专利商标事务所有限公司 | 代理人 | 张志辉 |
地址 | 519080广东省珠海市高新区唐家湾镇港乐路8号大洲科技园B区厂房803室 | ||
法律状态 | - |
摘要
摘要 | 本发明涉及一种真实场景下的婴儿哭声检测方法、装置及可读介质的技术方案,包括:采集真实场景下包括有婴儿哭声的音频数据,将音频数据作为数据集进行标注及前处理,得到网络输入数据;将网络输入数据输入至包括有特征提取网络、人声检测网络及哭声检测网络的深度神经网络,并分别进行特征提取、人声检测及哭声检测的训练,得到人声检测网络和哭声检测网络对应的第一损失函数及第二损失函数;对深度神经网络整体进行训练得到第三损失函数,得到婴儿哭声检测模型;通过婴儿哭声检测模型对输入的真实场景采集的音频数据进行检测,得到真实场景的婴儿哭声检测结果。本发明的有益效果为:能够在相对较短的时间内较为准确地检测出婴儿哭声。 |
