一种可视化机器学习训练模型的建模系统和方法

基本信息

申请号 CN201710501660.1 申请日 -
公开(公告)号 CN107169575A 公开(公告)日 2017-09-15
申请公布号 CN107169575A 申请公布日 2017-09-15
分类号 G06N99/00;G06F9/50 分类 计算;推算;计数;
发明人 殷晋 申请(专利权)人 北京天机数测数据科技有限公司
代理机构 - 代理人 -
地址 100125 北京市朝阳区霞光里9号16层1601室
法律状态 -

摘要

摘要 本发明涉及一种可视化机器学习训练模型的建模系统和方法,系统包括:流程设计器,用于根据用户将选择的图形化算法组件拖拽的操作来建立图形化算法组件中的算法之间的数据流向,并生成流程描述语言;流程解析器,用于对流程设计器生成的流程描述语言进行解析,创建相应的学习组件,并生成相应的Spark学习管道;和流程调度器,用于将Spark学习管道提交到Spark集群上进行模型训练。通过选择相应图形化算法组件,并拖拽建立算法之间的数据流向,生成流程描述语言,再解析流程描述语言,根据节点类名及属性创建相应的学习组件,并生成相应的Spark学习管道,再提交到Spark集群上进行模型训练,可以实现高质量机器学习建模。