AI文章
IT
问题解决
Python
问答社区
AI导航
版权声明
登录
注册
AI技术聚合
首页
MDP
MDP
技术文章
MDP的决策迭代和值迭代
MDP(马尔可夫决策过程) 给定当前状态,未来和过去是独立的。对于MDP,行动的结果仅取决于当前状态,而和过去没关系,这种特性有时被称为“无记忆性”。这个过程可以概括为五个部分: …
青葱年少
2022年3月25日
586
0
0
此站出售,如需请站内私信或者邮箱!