问答题

在强化学习中,以下哪种算法结合了策略梯度和价值函数的优势?

答案: A.A3C
B.DQN
C.TD3
D.Sarsa
正确答案:C
答案解析:TD3结合了策略梯度和价值函数的优势。
题目列表

你可能感兴趣的试题