一种深度学习中超参数的优化选取方法

基本信息

申请号 CN201810282510.0 申请日 -
公开(公告)号 CN108470210A 公开(公告)日 2018-08-31
申请公布号 CN108470210A 申请公布日 2018-08-31
分类号 G06N3/04 分类 计算;推算;计数;
发明人 曹连雨 申请(专利权)人 中科弘云科技(北京)有限公司
代理机构 - 代理人 -
地址 100085 北京市海淀区西二旗西路2号院领秀新硅谷B区83号楼3单元102
法律状态 -

摘要

摘要 本发明公开了一种深度学习中超参数的优化选取方法,其步骤为:定义n个待训练模型;定义函数eval以当前变化的模型参数θ的值来评估模型的优劣,随机选取数个θ的值,计算得出相应的eval(θ);计算这些点中每一个点的均值和方差,再预估可能的使eval(θ|h)最大的θ取值;得到下一采样点后,计算eval(θ|h);如果此时的step数满足预设条件则进入下一步骤,否则回到循环;计算当前所有并行计算模型的eval(θ|h),并将其从大到小排序,定义优质及劣质;对每一个劣质模型进行淘汰操作;对每一个完成淘汰操作的劣质模型,立即进行进化操作;步骤完成后,回到循环。本发明在加快参数优化耗时的同时,可以有效减少资源消耗,并且可应对多超参数的情况。