一种多媒体采集装置和方法

基本信息

申请号 CN201210283273.2 申请日 -
公开(公告)号 CN103581606A 公开(公告)日 2014-02-12
申请公布号 CN103581606A 申请公布日 2014-02-12
分类号 H04N7/14(2006.01)I;H04N7/15(2006.01)I;H04N5/232(2006.01)I;G10L15/06(2013.01)I 分类 电通信技术;
发明人 孙敏刚;赵照 申请(专利权)人 北京维鲸视界科技有限公司
代理机构 - 代理人 -
地址 100080 北京市海淀区知春路51号慎昌大厦5026室
法律状态 -

摘要

摘要 本发明公开了一种多媒体采集装置和方法,属于多媒体领域。装置包括:音频采集单元,包括至少四个采集通道,用于采集发言者的发出的音频信号;音频分析单元,用于将采集到的发言者的音频信号中的特征量在预置的语音模型中进行匹配分析,实时定位发言者的位置信息;视频同步单元,用于根据发言者的位置信息实时调整摄像头,从而使摄像头采集含有发言者的视频信号。本发明通过至少四通道对外部音场进行检测采集,并基于语音模型对所得的音场环境中的当前发言者进行跟踪,则得出发言者的相对位置并实时调整摄像头进行音频和视频同步采集;且四个采集通道均衡设置,摄像头转动灵活,也通过多个通道扩大了音频采集的范围,从而采集立体效果的音频质量。