基于深度强化学习对银行风险定价的优化方法和装置
基本信息
申请号 | CN202011486443.8 | 申请日 | - |
公开(公告)号 | CN112488826A | 公开(公告)日 | 2021-03-12 |
申请公布号 | CN112488826A | 申请公布日 | 2021-03-12 |
分类号 | G06N3/08(2006.01)I;G06Q40/02(2012.01)I;G06Q10/06(2012.01)I | 分类 | 计算;推算;计数; |
发明人 | 段行健;田春明;曹然 | 申请(专利权)人 | 北京逸风金科软件有限公司 |
代理机构 | 北京汇捷知识产权代理事务所(普通合伙) | 代理人 | 于鹏 |
地址 | 100083北京市西城区阜成门外大街31号4层421A | ||
法律状态 | - |
摘要
摘要 | 本公开提供了基于深度强化学习对银行风险定价的优化方法,对动作值函数网络参数和策略网络参数进行初始化;通过现有初始化的网络与银行模拟环境进行交互,完成初始化经验回放;通过均匀分布在经验回放池中采样,获取训练样本;通过动作值函数网络和策略网络的损失函数对当前网络的参数进行更新;经过多轮训练,通过预设的更新方式,将当前网络的参数复制到目标网络中以完成对银行风险定价的优化操作。该方法能够用沙盘模拟平台的仿真银行模拟环境,基于深度强化学习算法进行模型训练,得到可应用于真实银行经营和场景的模型,并推测出系统性风险约束下银行最优的风险定价。本公开还涉及基于深度强化学习对银行风险定价的优化装置。 |
