问答题

在强化学习中,当环境的动态模型未知时,哪种算法通常更适用?

答案: A.策略梯度算法
B.基于模型的算法
C.无模型的算法
D.动态规划算法
正确答案:C
答案解析:当环境动态模型未知时,无模型的算法通常更适用。
题目列表

你可能感兴趣的试题