基于弹性分布式数据模型的多维度信息提取方法及装置
基本信息
申请号 | CN202010034181.5 | 申请日 | - |
公开(公告)号 | CN110851432A | 公开(公告)日 | 2020-02-28 |
申请公布号 | CN110851432A | 申请公布日 | 2020-02-28 |
分类号 | G06F16/215;G06F16/2458;G06F16/25;G06F16/28;G06F16/951 | 分类 | 计算;推算;计数; |
发明人 | 冯世伟;吴正好;李锁在;韩鹏;刘涛;朱慧彤;闫永灿;席邵宾;张超超;胡坚升;乔拥俊 | 申请(专利权)人 | 中软信息系统工程有限公司 |
代理机构 | 北京超凡宏宇专利代理事务所(特殊普通合伙) | 代理人 | 中软信息系统工程有限公司 |
地址 | 102209 北京市昌平区北七家镇未来科技城南区中国电子信息安全技术研发基地 | ||
法律状态 | - |
摘要
摘要 | 本申请提供一种基于弹性分布式数据模型的多维度信息提取方法及装置,方法包括:获取第一预设格式的数据;利用弹性分布式数据模型对第一预设格式的数据进行数据处理;将数据处理后的数据依据维度进行数据标注;根据数据标注的结果生成数据维度表,以完成对第一预设格式的数据的信息提取。因此,可以根据网页数据以及业务数据得到第一预设格式的数据,然后利用弹性分布式数据模型对上述数据进行数据处理最终实现对网页数据以及业务数据的信息提取。其中,利用弹性分布式数据模型进行信息提取时,可以对海量的数据进行操作,从而增加信息提取的工作效率;同时,具有强大的复原能力,可以实现多维度的信息提取,从而充分展示数据之间的关联性。 |
