基于特征计算图的可视化机器学习特征提取系统及方法

基本信息

申请号 CN202110356959.9 申请日 -
公开(公告)号 CN113010164A 公开(公告)日 2021-06-22
申请公布号 CN113010164A 申请公布日 2021-06-22
分类号 G06F8/34;G06F8/38;G06F9/451;G06N20/00 分类 计算;推算;计数;
发明人 彭艳宏;王雄 申请(专利权)人 杭州初灵数据科技有限公司
代理机构 杭州君度专利代理事务所(特殊普通合伙) 代理人 陈炜
地址 311799 浙江省杭州市淳安县千岛湖镇阳光路688号257-5
法律状态 -

摘要

摘要 本发明提供了一种基于特征计算图的可视化机器学习特征提取系统及方法。首先,将结构化原始数据集各列、特征变换函数以及输出项抽象成节点控件绘制在图形界面上;然后,由用户根据自身需求拖动节点控件搭建特征工程处理流程;最后,数据处理模块读取用户搭建的特征计算图,利用深度优先搜索遍历各个节点提取特征,完成特征转换。本发明通过将机器学习特征提取阶段的流程图抽象成特征计算图,从而让用户可以通过拖动控件的方式自主搭建数据处理流程,降低了特征提取任务的难度,且方便修改调试,有助于降低数据处理人员的心智负担,还可以让非专业人员参与到相关项目中来。