一种多媒体采集装置和方法

基本信息

申请号 CN201210283273.2 申请日 -
公开(公告)号 CN103581606B 公开(公告)日 2018-09-07
申请公布号 CN103581606B 申请公布日 2018-09-07
分类号 H04N7/14;H04N7/15;H04N5/232;G10L15/06 分类 电通信技术;
发明人 孙敏刚;赵照 申请(专利权)人 北京维鲸视界科技有限公司
代理机构 北京市隆安律师事务所 代理人 北京维鲸视界科技有限公司
地址 100085 北京市海淀区上地三街9号C座C612
法律状态 -

摘要

摘要 本发明公开了一种多媒体采集装置和方法,属于多媒体领域。装置包括:音频采集单元,包括至少四个采集通道,用于采集发言者的发出的音频信号;音频分析单元,用于将采集到的发言者的音频信号中的特征量在预置的语音模型中进行匹配分析,实时定位发言者的位置信息;视频同步单元,用于根据发言者的位置信息实时调整摄像头,从而使摄像头采集含有发言者的视频信号。本发明通过至少四通道对外部音场进行检测采集,并基于语音模型对所得的音场环境中的当前发言者进行跟踪,则得出发言者的相对位置并实时调整摄像头进行音频和视频同步采集;且四个采集通道均衡设置,摄像头转动灵活,也通过多个通道扩大了音频采集的范围,从而采集立体效果的音频质量。