基于正则匹配的文本识别方法、文本识别装置和电子设备

基本信息

申请号 CN202011576184.8 申请日 -
公开(公告)号 CN112580345A 公开(公告)日 2021-03-30
申请公布号 CN112580345A 申请公布日 2021-03-30
分类号 G06F40/284(2020.01)I;G06F40/289(2020.01)I;G06K9/00(2006.01)I 分类 计算;推算;计数;
发明人 熊思宇;朱永强 申请(专利权)人 成都网安科技发展有限公司
代理机构 成都极刻智慧知识产权代理事务所(普通合伙) 代理人 唐维虎
地址 610000四川省成都市高新西区创业中心A224
法律状态 -

摘要

摘要 本申请提供的基于正则匹配的文本识别方法、文本识别装置和电子设备,涉及文本识别技术领域。在本申请中,首先,获取待识别文本,其中,待识别文本包括至少一个基于变长编码表示的待识别字符。其次,在至少一个待识别字符中确定一个目标待识别字符,并将目标待识别字符转换为目标进制的目标数字。然后,基于确定有限状态自动机对目标数字进行匹配处理,其中,确定有限状态自动机基于对目标正则表达式进行转换处理得到,且确定有限状态自动机中每一条转移边对应的字符基于目标进制表示。最后,若目标数字匹配失败,则停止对待识别文本进行匹配处理。基于上述方法,可以改善现有的文本识别技术中存在的资源浪费的问题。