A.反馈立即生效B.反馈可能需要等到整个训练结束后才会得到C.反馈不重要D.反馈只在特定情况下生效
A.状态和反馈随时间变化B.时间不重要C.时间只影响智能体的动作D.时间只影响环境的变化
A.决定是否使用神经网络B.决定是否选择最优动作还是随机动作C.决定学习率的大小D.决定奖励的分配