一种基于视频通讯的语音转文字方法

基本信息

申请号 CN202010547221.6 申请日 -
公开(公告)号 CN111798854A 公开(公告)日 2020-10-20
申请公布号 CN111798854A 申请公布日 2020-10-20
分类号 G10L15/26(2006.01)I 分类 乐器;声学;
发明人 蒲瑶;何国涛;李全忠 申请(专利权)人 普强信息技术(北京)有限公司
代理机构 北京科亿知识产权代理事务所(普通合伙) 代理人 汤东凤
地址 100000北京市海淀区上地信息路26号5层0523房间
法律状态 -

摘要

摘要 本发明公开了一种基于视频通讯的语音转文字方法,包括以下步骤:S1.将预设语音文本库和预设特征词和敏感词文本库存入服务器内;S2.采集音频数据,然后进行语音识别;S3.将语音识别的音频数据进行纠错处理,生成目标文字信息;S4.对S3中的目标文字信息进行特征词识别,然后生成转化文字信息;S5.将S4中的转化文字信息发送给服务器,并保存;S6.把服务器收到的文字信息渲染到视频上,显示到用户指定的区域上。本发明通过进行纠错处理,能够在语音转文字的过程中实现对同音字的纠错,进而提高语音转文字的准确性,从而提高了用户的体验,另外通过特征词的识别,在需要发送敏感词时,不必说出敏感词,也可以发送敏感文字,避免直接说出敏感词的尴尬。