文本校正方法、装置和设备

基本信息

申请号 CN201910870203.9 申请日 -
公开(公告)号 CN110688833A 公开(公告)日 2020-01-14
申请公布号 CN110688833A 申请公布日 2020-01-14
分类号 G06F40/205(2020.01); G06F9/448(2018.01) 分类 计算;推算;计数;
发明人 齐全; 裘初; 高鹏东; 穆凯辉; 王博 申请(专利权)人 苏州创意云网络科技有限公司
代理机构 北京三友知识产权代理有限公司 代理人 苏州创意云网络科技有限公司
地址 215000 江苏省苏州市高新区科技城科灵路78号
法律状态 -

摘要

摘要 本申请提供了一种文本校正方法、装置和设备,其中,该方法包括:确定目标文本包含的多个特征信息中各个特征信息的信息序列;根据各个特征信息的信息序列的类型对多个特征信息进行分类,得到标准特征信息集和待调整特征信息集;将所述标准特征信息集对应的各个类型的信息序列转换为有限状态自动机;基于有限状态自动机,确定所述各个类型的信息序列与待调整特征信息集的匹配度;将匹配度最高值对应的信息序列作为校正信息序列对待调整特征信息集中各特征信息的信息序列进行校正。在本申请实施例中,可以根据目标文本中各个特征信息的标准撰写方式,对待调整特征信息集中的各特征信息进行二次校正,从而提高对目标文本的特征信息识别的准确度。