一种数据处理方法及装置

基本信息

申请号 CN202111517670.7 申请日 -
公开(公告)号 CN114387599A 公开(公告)日 2022-04-22
申请公布号 CN114387599A 申请公布日 2022-04-22
分类号 G06V30/148(2022.01)I;G06F40/289(2020.01)I 分类 计算;推算;计数;
发明人 李勇;贾江凯;王帅;李凯强 申请(专利权)人 国网电商科技有限公司
代理机构 北京集佳知识产权代理有限公司 代理人 李慧慧
地址 100053北京市西城区广安门内大街311号
法律状态 -

摘要

摘要 本发明公开了一种数据处理方法及装置,可以获得待处理的字符串,待处理的字符串中包括已知字符和至少一个待识别字符,各待识别字符均存在至少两个相似字符;确定至少一个组合字符串,各组合字符串均是由已知字符和各待识别字符分别对应的一个相似字符经过有序组合而生成的;获得各组合字符串的分词信息;将分词数最少的分词信息确定为待处理分词信息;如果待处理分词信息的数量为多个,则确定各待处理分词信息中的分词匹配程度;将分词匹配程度最高的待处理分词信息确定为目标分词信息;将目标分词信息对应的组合字符串确定为正确字符串;基于正确字符串,确定待处理的字符串中的各待识别字符。本发明可以有效提高对文本的整体识别率。