问答题

在强化学习中,以下哪种奖励函数设计更有利于长期目标的实现?

答案: A.稀疏奖励
B.密集奖励
C.基于策略的奖励
D.基于价值的奖励
正确答案:A
答案解析:稀疏奖励通常更有利于强化学习模型学习到长期目标的实现策略。
题目列表

你可能感兴趣的试题