一种数据分析引擎的数据探索方法及系统

基本信息

申请号 CN202011381625.9 申请日 -
公开(公告)号 CN112579582A 公开(公告)日 2021-03-30
申请公布号 CN112579582A 申请公布日 2021-03-30
分类号 G06F16/215;G06F16/2458;G06F16/951 分类 计算;推算;计数;
发明人 张涛;雷厚宇;杨启帆;陆苇;黄纪萍;陶心万;江波 申请(专利权)人 贵州力创科技发展有限公司
代理机构 北京轻创知识产权代理有限公司 代理人 厉洋洋
地址 550014 贵州省贵阳市国家高新技术产业开发区金阳科技产业园毕节路53号贵阳科技大厦1层1号、13层1号
法律状态 -

摘要

摘要 本发明涉及一种数据分析引擎的数据探索方法及系统,其方法包括,采集外部大数据并对外部大数据进行清理和结构化处理,得到结构化数据集;对结构化数据集中的结构化数据进行特征化,得到每个结构化数据的特征值,并形成特征值集合;基于深度学习数据模型对特征值集合进行数据探索,得到数据探索结果。本发明在数据采集阶段先进行一次数据清洗,然后在数据特征阶段又进行一次数据过滤,将无法进行数据探索的无用数据排除,避免无用数据占据数据探索时间,提高数据探索效率;在数据探索之前,先进行数据结构化,再进行数据特征化,使得数据特征容易识别,利用反向探索使正向探索的权值收敛,增加数据探索的精度。