一种基于任务并行的细粒度分布式深度森林训练方法

基本信息

申请号 CN202010193428.8 申请日 -
公开(公告)号 CN111414961A 公开(公告)日 2020-07-14
申请公布号 CN111414961A 申请公布日 2020-07-14
分类号 G06K9/62(2006.01)I 分类 -
发明人 朱光辉 申请(专利权)人 江苏鸿程大数据技术与应用研究院有限公司
代理机构 北京联瑞联丰知识产权代理事务所(普通合伙) 代理人 江苏鸿程大数据技术与应用研究院有限公司
地址 210000江苏省南京市江北新区研创园团结路99号孵鹰大厦1120室
法律状态 -

摘要

摘要 本发明公开了一种基于任务并行的细粒度分布式深度森林训练方法,包括以下步骤:(a)在深度森林的每一层,其中每一个森林被拆分成多个均匀的子森林,其中每个子森林对应一个计算任务;(b)为子森林设置合适的随机状态,为子森林训练时的交叉验证设置合适的随机状态;(c)将子森林训练任务发放到各个计算节点执行;(d)采用Tree‑Reduce树形合并法将属于同一个随机森林的子森林的结果合并,得到该原始随机森林的训练结果,完成多个森林的并行训练。以提高深度森林训练效率,促进其应用与解决实际问题。