智能体训练方法及装置、存储介质及电子设备
基本信息
申请号 | CN202010901910.2 | 申请日 | - |
公开(公告)号 | CN112036578A | 公开(公告)日 | 2020-12-04 |
申请公布号 | CN112036578A | 申请公布日 | 2020-12-04 |
分类号 | G06N20/00;G06N3/08;G06F8/30 | 分类 | 计算;推算;计数; |
发明人 | 李焱;覃小春;李佶学 | 申请(专利权)人 | 成都数字天空科技有限公司 |
代理机构 | 北京超凡宏宇专利代理事务所(特殊普通合伙) | 代理人 | 成都数字天空科技有限公司 |
地址 | 610041 四川省成都市高新区中国(四川)自由贸易试验区成都天华二路219号7栋6层 | ||
法律状态 | - |
摘要
摘要 | 本申请涉及人工智能技术领域,提供一种智能体训练方法及装置、存储介质及电子设备。其中,智能体训练方法包括:接收第一算法侧发起的第一动作执行请求;向第一环境侧发送作为第一环境侧之前发起的第一动作获取请求的返回结果的第一动作,以使第一环境侧执行第一动作;接收第一环境侧发起的第二动作获取请求;向第一算法侧发送作为第一动作执行请求的返回结果的第二状态,以使第一算法侧根据第二状态更新智能体,并获取更新后的智能体选择出的第二动作,第二动作为第一算法侧之后要发起的第二动作执行请求中携带的动作。该方法使得算法设计人员和环境开发人员都可以按照自己习惯的逻辑进行程序开发,因此显著提高了算法和环境开发的效率。 |
