一种OCR识别纠错装置和方法
基本信息
申请号 | CN202111202786.1 | 申请日 | - |
公开(公告)号 | CN113849609A | 公开(公告)日 | 2021-12-28 |
申请公布号 | CN113849609A | 申请公布日 | 2021-12-28 |
分类号 | G06F16/33(2019.01)I;G06F16/35(2019.01)I;G06F40/232(2020.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 曾祥云;朱姬渊 | 申请(专利权)人 | 上海易康源医疗健康科技有限公司 |
代理机构 | 上海硕力知识产权代理事务所(普通合伙) | 代理人 | 王法男 |
地址 | 200120 上海市浦东新区中国(上海)自由贸易试验区临港新片区新杨公路860号10幢 | ||
法律状态 | - |
摘要
摘要 | 本发明公开一种OCR识别纠错装置和方法,其中的OCR识别纠错装置包括特征抽取模块、特征拼接模块、分类检错模块、分类纠错模块、特征融合模块、纠错验证模块、目标函数模块,其中:特征抽取模块用以提取句子中每个字的特征;特征拼接模块用以将每个字的特征进行拼接使得特征更丰富;分类检错模块用以检测是否存在错字;特征融合模块用以将特征进行融合;分类纠错模块用以对错误的字进行纠正;目标函数模块用以优化OCR识别纠错装置的参数以及度量OCR识别纠错装置的准确率。采用本发明所述的模型和方法,采用了联合学习的架构,在OCR识别纠错中能明显提高纠错率,具有较好的推广意义。 |
