文件处理方法、系统、装置及介质
基本信息
申请号 | CN202010286711.5 | 申请日 | - |
公开(公告)号 | CN111507236A | 公开(公告)日 | 2020-08-07 |
申请公布号 | CN111507236A | 申请公布日 | 2020-08-07 |
分类号 | G06K9/00;G06F16/21;G06F16/23 | 分类 | - |
发明人 | 陈康;杨永彪;路强;陈希 | 申请(专利权)人 | 上海朗曦信息技术有限公司 |
代理机构 | 上海段和段律师事务所 | 代理人 | 上海朗曦信息技术有限公司 |
地址 | 201799 上海市青浦区天辰路2801-2809号5幢3层C区398室 | ||
法律状态 | - |
摘要
摘要 | 本发明文件处理方法、系统、装置及介质,包括如下步骤:步骤1,输入文件;步骤2,读取文件并获取文件中的文字信息;步骤3,通过文字信息获取文本信息团块;步骤4,通过文本信息团块形成结构化数据。与现有技术相比,本发明具有如下优势:对文本型文件和图像型文件进行识别并分类;将识别后的文件统一转化为数据内容,并存档,本发明使用Json格式存储数据内容;对数据内容进行分析处理确定其信息之间的关系,对信息进行结构化处理并存储。 |
