一种快速建模的方法

基本信息

申请号 CN201911121863.3 申请日 -
公开(公告)号 CN111079937A 公开(公告)日 2020-04-28
申请公布号 CN111079937A 申请公布日 2020-04-28
分类号 G06N20/00;G06N20/10 分类 计算;推算;计数;
发明人 盛森 申请(专利权)人 苏州金智渠信息技术有限公司
代理机构 - 代理人 -
地址 215100 江苏省苏州市吴中区工业园区星湖街328号创意产业园7-8F单元
法律状态 -

摘要

摘要 本发明提供了一种快速建模的方法,包括:读取配置文件参数并检查输入数据,进行数据类型转化;预处理:缺失值、异常值处理,类别变量编码,时间变量处理,数据失衡处理;特征衍生:根据配置文件对输入原始变量进行衍生;特征选择:进行级联式特征过滤;对算法模型进行训练;模型估计;两数据集距离度量:针对模型训练集、测试集、预测集使用多种距离度量,以辅助建模,变量过滤,数据集之间的差异评估。本发明降低了不同算法人员经验和能力的差异导致的不良学习结果,大大降低了机器学习应用的门槛,并且该框架具有很高的可扩展性和可用性,各个功能都可以组合以灵活应对实际使用需求的变化。