一种方便数据分析人员使用的集成机器学习的方法及系统
基本信息
申请号 | CN201711393846.6 | 申请日 | - |
公开(公告)号 | CN108363714A | 公开(公告)日 | 2018-08-03 |
申请公布号 | CN108363714A | 申请公布日 | 2018-08-03 |
分类号 | G06F17/30;G06K9/62;G06N99/00 | 分类 | 计算;推算;计数; |
发明人 | 李雪鹏;翟昶;于上上;冯博;毛智愚 | 申请(专利权)人 | 北京至信普林科技有限公司 |
代理机构 | - | 代理人 | - |
地址 | 100094 北京市海淀区西北旺东路10号院东区5号楼六层603号 | ||
法律状态 | - |
摘要
摘要 | 本发明涉及机器学习技术领域,特别涉及一种方便数据分析人员使用的集成机器学习的方法及系统。所述方法包括以下步骤:(1)数据探索;(2)数据清洗;(3)特征提取;(4)特征选择;(5)样本采样;(6)模型训练;(7)模型优化;(8)模型融合;(9)模型可解释性;(10)自然语言处理。所述系统包含数据处理模块、特征处理模块、模型处理模块和自然语言处理模块。本发明为机器学习工程师、学生、老师以及机器学习爱好着提供统一的算法建模流程,用20%的精力完成建模流程,把80%的精力放在对业务的理解和对模型应用上,深度理解业务,更好的实现业务人员对于模型的要求。 |
