一种基于人脸检测的音频定位方法及装置
基本信息
申请号 | CN201910988012.2 | 申请日 | - |
公开(公告)号 | CN110716180B | 公开(公告)日 | 2022-03-15 |
申请公布号 | CN110716180B | 申请公布日 | 2022-03-15 |
分类号 | G01S5/22(2006.01)I;G06V40/16(2022.01)I | 分类 | 测量;测试; |
发明人 | 方向阳;李骊 | 申请(专利权)人 | 北京华捷艾米科技有限公司 |
代理机构 | 北京集佳知识产权代理有限公司 | 代理人 | 杨华 |
地址 | 100193北京市海淀区东北旺西路8号院数字山谷A区1号楼5层 | ||
法律状态 | - |
摘要
摘要 | 本申请提供的基于人脸检测的音频定位方法及装置,获取使用音频定位算法确定的声源的位置信息,获取对图像进行人脸检测得到的人脸的位置信息,依据声源的位置信息,确定声源在图像中的位置信息,并依据声源在图像中的位置信息和人脸的位置信息,确定目标位置信息,最后依据目标位置信息和声源在图像中的位置信息,得到声源的校正后的位置信息。可见,本技术方案,通过将音频定位算法与对图像人脸检测算法相结合,得到声源的目标位置信息,因为,基于人脸检测算法得到的位置信息的准确度高,所以目标位置信息也是准确度较高的位置信息。同时,依据目标位置信息和声源在图像中的位置信息,对目标位置信息校正,使声源的校正后的位置信息更加准确。 |
