问答题

对于深度强化学习中的长期规划问题,以下哪种方法可以更好地处理?

答案: A.蒙特卡罗树搜索
B.策略梯度
C.价值函数估计
D.以上都不是
正确答案:A
答案解析:蒙特卡罗树搜索能更好地处理长期规划问题。
题目列表

你可能感兴趣的试题