一种语音与图像的匹配方法、装置、存储介质及设备

基本信息

申请号 CN202110733632.9 申请日 -
公开(公告)号 CN113506578A 公开(公告)日 2021-10-15
申请公布号 CN113506578A 申请公布日 2021-10-15
分类号 G10L17/22(2013.01)I;G10L15/22(2006.01)I;G10L15/25(2013.01)I;G06K9/00(2006.01)I;G10L15/26(2006.01)I 分类 乐器;声学;
发明人 李丰军;周剑光;李婷婷 申请(专利权)人 中汽创智科技有限公司
代理机构 广州三环专利商标代理有限公司 代理人 郝传鑫;贾允
地址 211100江苏省南京市江宁区秣陵街道胜利路88号
法律状态 -

摘要

摘要 本发明公开了一种语音与图像的匹配方法、装置、存储介质及设备,包括实时录音获得语音记录;响应于拍摄指令,拍照并输出图像;对所述图像进行人像识别,得到第一识别结果;其中,所述第一识别结果至少包括对所述图像中人像数量的识别;从所述语音记录中选取解析段,对所述解析段中的语音进行语音解析得到第二识别结果;其中,所述第二识别结果至少包括对所述语音记录中人像数量的识别;自动匹配所述第一识别结果与所述第二识别结果得到匹配关系,根据所述匹配关系合成带有语音的图像。本发明能够精确实现语音中声纹与图像中人像的自动识别与自动匹配,智能化地快速合成带有语音的图像,精确度高,方便快速,用户体验感受好。