一种实时分角色转录方法、设备和系统
基本信息
申请号 | CN202011477913.4 | 申请日 | - |
公开(公告)号 | CN112530411B | 公开(公告)日 | 2021-07-20 |
申请公布号 | CN112530411B | 申请公布日 | 2021-07-20 |
分类号 | G10L15/04;G10L15/08;G10L15/26;G10L25/03;G10L25/51 | 分类 | 乐器;声学; |
发明人 | 袁斌 | 申请(专利权)人 | 北京快鱼电子股份公司 |
代理机构 | 北京天盾知识产权代理有限公司 | 代理人 | 张彩珍 |
地址 | 100093 北京市海淀区闵庄路3号清华科技园玉泉慧谷11栋 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种实时分角色转录方法,包括检测采集到的左声道声音信号和右声道声音信号中是否含有语音段,若检测到语音段,则提取语音段对应的左声道语音段和右声道语音段;基于左声道语音段和右声道语音段的相位差、幅度差和基频检测,判断单双侧讲话;若为单侧讲话,则判断说话人是位于左侧还是右侧;若说话人位于左侧,则将左声道语音段进行聚类形成左侧聚类中心;若说话人位于右侧,则将右声道语音段进行聚类形成右侧聚类中心;若为双侧讲话,则分离左声道语音段和右声道语音段中包含的左右侧语音信号;并将分离后的左侧语音信号和右侧语音信号发送至语音识别引擎;该方法能对角色做到准确的分离。本发明还公开了实时分角色转录设备及系统。 |
