一种OCR识别结果纠错方法及装置

基本信息

申请号 CN201911338669.0 申请日 -
公开(公告)号 CN111144391A 公开(公告)日 2020-05-12
申请公布号 CN111144391A 申请公布日 2020-05-12
分类号 G06K9/03;G06K9/34;G06F40/284 分类 计算;推算;计数;
发明人 胡茜;刘宁;吴志超;王静 申请(专利权)人 北京爱医生智慧医疗科技有限公司
代理机构 北京路浩知识产权代理有限公司 代理人 陈玉婷
地址 102206 北京市昌平区科技园区生命园路9号院1号楼205室
法律状态 -

摘要

摘要 本发明实施例提供一种OCR识别结果纠错方法及装置。所述方法包括对待识别文字图像执行光学字符识别OCR和分词处理得到待纠错文本;对待纠错文本执行句法依存分析,得到依存搭配对;若依存搭配对不满足预设的搭配条件,则根据混淆集对依存搭配对中的分词进行替换,直到各依存搭配对均满足搭配条件;将更新后的待纠错文本作为所述待识别文字图像的纠错结果文本,本发明实施例通过对待纠错文本执行句法依存分析得到的各依存搭配对,若不满足预设的搭配条件,则采用混淆集对所述依存搭配对中的分词进行替换,直到满足所述搭配条件,并将更新后的待纠错文本作为纠错结果文本,从而能够更加准确快速得实现对OCR识别文本的纠错。