一种基于卷积神经网络的道路声信号分类方法

基本信息

申请号 CN202110199215.0 申请日 -
公开(公告)号 CN112560822B 公开(公告)日 2021-05-14
申请公布号 CN112560822B 申请公布日 2021-05-14
分类号 G06K9/00;G06N3/04;G06N3/08 分类 计算;推算;计数;
发明人 谢维;陈俊;郭宏成;刘世宇 申请(专利权)人 江苏聆世科技有限公司
代理机构 南京鑫之航知识产权代理事务所(特殊普通合伙) 代理人 姚兰兰
地址 210032 江苏省南京市江北新区星火路17号创智大厦B座632室
法律状态 -

摘要

摘要 本发明公开了一种基于卷积神经网络的道路声信号分类方法,步骤1、特征提取,步骤2、数据增强,步骤3、模型训练,步骤4、测试阶段,把待测声音样本使用步骤1的特征提取方法,得到待测声音梅尔能量频谱特征集,将待测声音梅尔能量频谱特征集中的测试样本输入到步骤3中训练好的卷积神经网络模型内,如果识别结果为机动车鸣笛声或非机动车鸣笛声,则通过声源定位和异常声发生时那一帧的图像生成声云图,并将声云图送入YOLOv3模型中计算出离声源中心最近的车辆是机动车还是非机动车。