一种从非结构化数据提取结构化数据的方法
基本信息
申请号 | CN201710757615.2 | 申请日 | - |
公开(公告)号 | CN107577460A | 公开(公告)日 | 2018-01-12 |
申请公布号 | CN107577460A | 申请公布日 | 2018-01-12 |
分类号 | G06F8/34;G06F8/30;G06F8/38;G06F8/41;G06F17/30 | 分类 | 计算;推算;计数; |
发明人 | 耐尔;屈朝晖 | 申请(专利权)人 | 苏州优圣美智能系统有限公司 |
代理机构 | 北京远大卓悦知识产权代理事务所(普通合伙) | 代理人 | 苏州优圣美智能系统有限公司 |
地址 | 215000 江苏省苏州市高新区科技城科创路18号综合楼2号楼6层 | ||
法律状态 | - |
摘要
摘要 | 本发明公开一种从非结构化数据提取结构化数据的方法,其包括以下步骤:建立模式库,其包括基于正则表达式编写获得的若干个模式;基于图像化操作,建立一个空的解析器;获取待解析数据中的一部分作为样本数据,了解解析需求;根据解析需求,调用至少一个模式,依次编辑分类规则和解析规则以对样本数据分类和解析,并将分类规则和解析规则存储至解析器;显示解析规则解析的样本数据的字段值名;在实际环境中部署所述解析器。本发明提供的从非结构化数据提取结构化数据的方法,解析操作基于图形化界面,操作灵活,无需面对编程文件,利于开发、更新与维护。 |
