文本识别方法、装置、设备和计算机可读介质

基本信息

申请号 CN201910689053.1 申请日 -
公开(公告)号 CN112307820B 公开(公告)日 2022-03-22
申请公布号 CN112307820B 申请公布日 2022-03-22
分类号 G06V30/19(2022.01)I;G06K9/62(2022.01)I 分类 计算;推算;计数;
发明人 潘能超 申请(专利权)人 北京易真学思教育科技有限公司
代理机构 北京合智同创知识产权代理有限公司 代理人 李杰
地址 100041北京市石景山区实兴大街30号院3号楼2层A-2667房间
法律状态 -

摘要

摘要 本申请实施例提供了一种文本识别方法、装置、设备和计算机可读介质。该方法包括:通过预先训练好的第一文本识别模型对待识别文本进行处理得到第一概率矩阵;根据第一概率矩阵确定第一识别结果;确定第一识别结果中中文字符的占比以及是否存在特殊字符;若中文字符的占比不小于预设阈值或存在特殊字符,将第一识别结果作为最终识别结果;若中文字符的占比小于预设阈值且不存在特殊字符,通过预先训练好的第二文本识别模型对待识别文本进行处理得到第二概率矩阵,根据第一概率矩阵和第二概率矩阵确定最终识别结果。通过对得到的概率矩阵进行处理以得到最终识别结果,提高对待识别文本的识别精度,实现对不同类别数据识别时具有良好的识别效果。