问答题

对于强化学习中的策略优化,以下哪种方法可以降低方差?

答案: A.优势函数估计
B.策略梯度估计
C.价值函数估计
D.动作值函数估计
正确答案:A
答案解析:优势函数估计可以降低策略优化中的方差。
题目列表

你可能感兴趣的试题