深度强化学习

本文通过整理李宏毅老师的机器学习教程的内容，简要介绍深度强化学习（deep reinforcement learning）中的 DQN（deep Q-network）算法。李宏毅…

技术文章 2023年3月1日

26500

技术文章

今天参考知乎岳小飞的博客尝试用一下比较标准的机械臂+强化学习的实战项目。这篇博客主要记录一下实现过程，当做个人学习笔记。在第一遍安装过程中遇到了panda-gym和stb3以及g…

2022年5月31日

86800

多臂赌博机问题代码实践 1. 实现一个拉杆数为10的多臂赌博机 # 导入需要使用的库,其中numpy是支持数组和矩阵运算的科学计算库,而matplotlib是绘图库 import …

技术文章 2022年4月26日

37400