一种基于视频通讯的语音转文字方法
基本信息
申请号 | CN202010547221.6 | 申请日 | - |
公开(公告)号 | CN111798854A | 公开(公告)日 | 2020-10-20 |
申请公布号 | CN111798854A | 申请公布日 | 2020-10-20 |
分类号 | G10L15/26(2006.01)I | 分类 | 乐器;声学; |
发明人 | 蒲瑶;何国涛;李全忠 | 申请(专利权)人 | 普强信息技术(北京)有限公司 |
代理机构 | 北京科亿知识产权代理事务所(普通合伙) | 代理人 | 汤东凤 |
地址 | 100000北京市海淀区上地信息路26号5层0523房间 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种基于视频通讯的语音转文字方法,包括以下步骤:S1.将预设语音文本库和预设特征词和敏感词文本库存入服务器内;S2.采集音频数据,然后进行语音识别;S3.将语音识别的音频数据进行纠错处理,生成目标文字信息;S4.对S3中的目标文字信息进行特征词识别,然后生成转化文字信息;S5.将S4中的转化文字信息发送给服务器,并保存;S6.把服务器收到的文字信息渲染到视频上,显示到用户指定的区域上。本发明通过进行纠错处理,能够在语音转文字的过程中实现对同音字的纠错,进而提高语音转文字的准确性,从而提高了用户的体验,另外通过特征词的识别,在需要发送敏感词时,不必说出敏感词,也可以发送敏感文字,避免直接说出敏感词的尴尬。 |
