一种从非结构化数据提取结构化数据的方法

基本信息

申请号 CN201710757615.2 申请日 -
公开(公告)号 CN107577460A 公开(公告)日 2018-01-12
申请公布号 CN107577460A 申请公布日 2018-01-12
分类号 G06F8/34;G06F8/30;G06F8/38;G06F8/41;G06F17/30 分类 计算;推算;计数;
发明人 耐尔;屈朝晖 申请(专利权)人 苏州优圣美智能系统有限公司
代理机构 北京远大卓悦知识产权代理事务所(普通合伙) 代理人 苏州优圣美智能系统有限公司
地址 215000 江苏省苏州市高新区科技城科创路18号综合楼2号楼6层
法律状态 -

摘要

摘要 本发明公开一种从非结构化数据提取结构化数据的方法,其包括以下步骤:建立模式库,其包括基于正则表达式编写获得的若干个模式;基于图像化操作,建立一个空的解析器;获取待解析数据中的一部分作为样本数据,了解解析需求;根据解析需求,调用至少一个模式,依次编辑分类规则和解析规则以对样本数据分类和解析,并将分类规则和解析规则存储至解析器;显示解析规则解析的样本数据的字段值名;在实际环境中部署所述解析器。本发明提供的从非结构化数据提取结构化数据的方法,解析操作基于图形化界面,操作灵活,无需面对编程文件,利于开发、更新与维护。