问答题

在强化学习中,以下哪种情况适合使用基于价值的方法?

答案: A.动作空间较大
B.动作空间较小
C.环境模型复杂
D.环境模型简单
正确答案:B
答案解析:动作空间较小时适合使用基于价值的方法。
题目列表

你可能感兴趣的试题