强化学习笔记

  • A2C算法原理及代码实现

    本文主要参考王树森老师的强化学习课程 1.A2C算法原理 A2C算法是策略学习中比较经典的一个算法,是在 Barto 等人1983年提出的。我们知道策略梯度方法用策略梯度更新策略网…

    2023年2月25日
    2790