一种数据可回溯的大规模离散型特征挖掘的方法

基本信息

申请号 CN201810120373.0 申请日 -
公开(公告)号 CN108287913A 公开(公告)日 2018-07-17
申请公布号 CN108287913A 申请公布日 2018-07-17
分类号 G06F17/30;G06Q40/02 分类 计算;推算;计数;
发明人 郭安 申请(专利权)人 霍尔果斯智融未来信息科技有限公司
代理机构 北京华识知识产权代理有限公司 代理人 李浩
地址 835000 新疆维吾尔自治区伊犁哈萨克自治州霍尔果斯经济开发区兵团分区开元路1号创新创业园孵化楼B-413-19室
法律状态 -

摘要

摘要 本发明公开了一种数据可回溯的大规模离散型特征挖掘的方法,线上请求和线下调研使用相同的特征计算lib,线上特征计算使用的原始数据快照通过缓存进行全量保存,保障线下调研使用的数据和当时线上使用的数据一致,当特征挖掘有新的想法,需要从之前的数据中挖掘新的特征,只需更新特征计算lib,按照大规模离散型特征挖掘架构,利用更多的数据样本制作模型。本发明可以保障在线、离线特征挖掘使用数据的一致性,模型生产不依赖于线上特征,离线调研完成即可上线,模型生产效率高,离线数据同步机制统一,开发维护成本低。