单项选择题

在强化学习中，哪个机制的引入使得强化学习具备了在利用与探索中寻求平衡的能力（）

A.Bellman方程
B.动态规划
C.蒙特卡洛采样
D.贪心策略

在线练习

你可能感兴趣的试题

与one-hot的单词表达不同，在词向量模型中，单词和单词之间的共现关系被忽略了。

答案：错误

一般而言，在深度学习模型中，层数越多，其完成的非线性映射就越复杂，因此模型就具有更强的学习能力。

答案：正确