一种基于高拍仪获得语音播放方法和系统
基本信息
申请号 | 2020109967792 | 申请日 | - |
公开(公告)号 | CN112259074A | 公开(公告)日 | 2021-01-22 |
申请公布号 | CN112259074A | 申请公布日 | 2021-01-22 |
分类号 | G10L13/04(2013.01)I; | 分类 | 乐器;声学; |
发明人 | 范国强;郭长青 | 申请(专利权)人 | 北京麦哲科技有限公司 |
代理机构 | 北京力量专利代理事务所(特殊普通合伙) | 代理人 | 姚远方 |
地址 | 100094北京市海淀区东北旺中关村软件园信息中心三层B306 | ||
法律状态 | - |
摘要
摘要 | 本发明提供了一种基于高拍仪获得语音播放方法,包括:步骤一,扫描预定图片,生成扫描图片;步骤二,通过OCR技术识别所述扫描图片预定区域的文字,生成识别文字;步骤三,通过TTS技术将所述识别文字转换成语音文件。通过先将预定的图片进行拍摄扫描,生存扫描图片,然后将扫描图片上预定区域的文字通过OCR技术进行识别,生成识别文字,识别文字可以为可编辑的文字,然后通过TTS技术将识别文字转换成语音文件,从而实现从图片到语音文件(MP3或WAV)的直接输出,提高拍摄仪等设备可以直接输出成语音文件的能力,提高使用便利性。 |
