深度强化学习
-
DQN(deep Q-network)算法简述
本文通过整理李宏毅老师的机器学习教程的内容,简要介绍深度强化学习(deep reinforcement learning)中的 DQN(deep Q-network)算法。 李宏毅…
-
机械臂强化学习实战(stable baselines3+panda-gym)
今天参考知乎岳小飞的博客尝试用一下比较标准的机械臂+强化学习的实战项目。这篇博客主要记录一下实现过程,当做个人学习笔记。 在第一遍安装过程中遇到了panda-gym和stb3以及g…
-
多臂赌博机问题代码实践
多臂赌博机问题代码实践 1. 实现一个拉杆数为10的多臂赌博机 # 导入需要使用的库,其中numpy是支持数组和矩阵运算的科学计算库,而matplotlib是绘图库 import …