问答题

在深度强化学习中,策略梯度定理基于以下哪个概念?

答案: A.贝尔曼方程
B.信息熵
C.对数似然
D.哈密顿原理
正确答案:C
答案解析:策略梯度定理基于对数似然的概念。
题目列表

你可能感兴趣的试题