一种OCR识别纠错装置和方法

基本信息

申请号 CN202111202786.1 申请日 -
公开(公告)号 CN113849609A 公开(公告)日 2021-12-28
申请公布号 CN113849609A 申请公布日 2021-12-28
分类号 G06F16/33(2019.01)I;G06F16/35(2019.01)I;G06F40/232(2020.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I 分类 计算;推算;计数;
发明人 曾祥云;朱姬渊 申请(专利权)人 上海易康源医疗健康科技有限公司
代理机构 上海硕力知识产权代理事务所(普通合伙) 代理人 王法男
地址 200120 上海市浦东新区中国(上海)自由贸易试验区临港新片区新杨公路860号10幢
法律状态 -

摘要

摘要 本发明公开一种OCR识别纠错装置和方法,其中的OCR识别纠错装置包括特征抽取模块、特征拼接模块、分类检错模块、分类纠错模块、特征融合模块、纠错验证模块、目标函数模块,其中:特征抽取模块用以提取句子中每个字的特征;特征拼接模块用以将每个字的特征进行拼接使得特征更丰富;分类检错模块用以检测是否存在错字;特征融合模块用以将特征进行融合;分类纠错模块用以对错误的字进行纠正;目标函数模块用以优化OCR识别纠错装置的参数以及度量OCR识别纠错装置的准确率。采用本发明所述的模型和方法,采用了联合学习的架构,在OCR识别纠错中能明显提高纠错率,具有较好的推广意义。