单项选择题

在强化学习中,哪个机制的引入使得强化学习具备了在利用与探索中寻求平衡的能力()

A.Bellman方程
B.动态规划
C.蒙特卡洛采样
D.贪心策略

在线练习
微信扫码免费搜题