一种基于人脸检测的音频定位方法及装置

基本信息

申请号 CN201910988012.2 申请日 -
公开(公告)号 CN110716180B 公开(公告)日 2022-03-15
申请公布号 CN110716180B 申请公布日 2022-03-15
分类号 G01S5/22(2006.01)I;G06V40/16(2022.01)I 分类 测量;测试;
发明人 方向阳;李骊 申请(专利权)人 北京华捷艾米科技有限公司
代理机构 北京集佳知识产权代理有限公司 代理人 杨华
地址 100193北京市海淀区东北旺西路8号院数字山谷A区1号楼5层
法律状态 -

摘要

摘要 本申请提供的基于人脸检测的音频定位方法及装置,获取使用音频定位算法确定的声源的位置信息,获取对图像进行人脸检测得到的人脸的位置信息,依据声源的位置信息,确定声源在图像中的位置信息,并依据声源在图像中的位置信息和人脸的位置信息,确定目标位置信息,最后依据目标位置信息和声源在图像中的位置信息,得到声源的校正后的位置信息。可见,本技术方案,通过将音频定位算法与对图像人脸检测算法相结合,得到声源的目标位置信息,因为,基于人脸检测算法得到的位置信息的准确度高,所以目标位置信息也是准确度较高的位置信息。同时,依据目标位置信息和声源在图像中的位置信息,对目标位置信息校正,使声源的校正后的位置信息更加准确。