一种可灵活配置、灵活定义的文字识别编改校对系统

基本信息

申请号 CN201810030535.1 申请日 -
公开(公告)号 CN108170658A 公开(公告)日 2018-06-15
申请公布号 CN108170658A 申请公布日 2018-06-15
分类号 G06F17/24;G06F17/27;G06K9/34 分类 计算;推算;计数;
发明人 王长征;员战强;胡志强;刘文晓;梁询 申请(专利权)人 山西同方知网数字出版技术有限公司
代理机构 北京天奇智新知识产权代理有限公司 代理人 山西同方知网数字出版技术有限公司
地址 030006 山西省太原市高新区产业路48号新岛科技园D座
法律状态 -

摘要

摘要 本发明公开了一种可灵活配置、灵活定义的文字识别编改校对系统,包括:所述管理模块,用于对任务的分配、暂停与中断,并根据任务的属性信息进行系统运行参数配置以及根据质量结果要求配置相应的工艺引擎与相似字符集集合;然后根据识别引擎对编改后的结果进行质量评估;计算机引擎模块,用于对待处理的图片进行版面自动分析、图像分割与图像识别,并将多种识别引擎的识别结果进行“归一化”拼版,根据置信度对比,确定本编改系统的文字置信度,然后根据在线学习,修订编改系统的文字置信度;流程支持模块,用于支持对待处理图片形成的编改任务,并支持编改校对任务的在编改、校对与质检,以及对编校过的文字质量进行评估控制。