音频翻译多语言文字处理方法和系统

基本信息

申请号 CN201610647853.3 申请日 -
公开(公告)号 CN106303695A 公开(公告)日 2017-01-04
申请公布号 CN106303695A 申请公布日 2017-01-04
分类号 H04N21/4402(2011.01)I;H04N21/488(2011.01)I;H04N21/439(2011.01)I;G06F17/28(2006.01)I 分类 电通信技术;
发明人 马士华 申请(专利权)人 北京东方嘉禾文化发展股份有限公司
代理机构 北京润文专利代理事务所(普通合伙) 代理人 丁继恩
地址 100007 北京市东城区藏经馆胡同17号嘉城印象B区3层
法律状态 -

摘要

摘要 本发明提供了一种音频翻译为多语言文字处理方法和系统,包括如下步骤:分析语音音频文件,根据用户语音的强弱程度产生多个波形文件;根据每个波形文件的波形特征确定多个语音的开始和结束,生成多个第一格式化处理结果,得到多个第一语音音频段;对每个第一语音音频段利用语音识别软件进行语音到文字的转换,并生成多个第二格式化的处理结果,得到多个第一语音音频段对应的多个原始文字文件;将第一格式处理结果、原始文字文件根据序列号进行合并,得到相应的音频的字幕文件。其实现快速大量甚至批量自动化地生成字幕。