一种基于高拍仪获得语音播放方法和系统

基本信息

申请号 2020109967792 申请日 -
公开(公告)号 CN112259074A 公开(公告)日 2021-01-22
申请公布号 CN112259074A 申请公布日 2021-01-22
分类号 G10L13/04(2013.01)I; 分类 乐器;声学;
发明人 范国强;郭长青 申请(专利权)人 北京麦哲科技有限公司
代理机构 北京力量专利代理事务所(特殊普通合伙) 代理人 姚远方
地址 100094北京市海淀区东北旺中关村软件园信息中心三层B306
法律状态 -

摘要

摘要 本发明提供了一种基于高拍仪获得语音播放方法,包括:步骤一,扫描预定图片,生成扫描图片;步骤二,通过OCR技术识别所述扫描图片预定区域的文字,生成识别文字;步骤三,通过TTS技术将所述识别文字转换成语音文件。通过先将预定的图片进行拍摄扫描,生存扫描图片,然后将扫描图片上预定区域的文字通过OCR技术进行识别,生成识别文字,识别文字可以为可编辑的文字,然后通过TTS技术将识别文字转换成语音文件,从而实现从图片到语音文件(MP3或WAV)的直接输出,提高拍摄仪等设备可以直接输出成语音文件的能力,提高使用便利性。