多项选择题

关于Double DQN说法正确的是()。A、Q值的目标值中的max操作会产生过估计,从而影响找到最佳策略B、Double DQN可以减小偏差C、Double DQN的目标函数与DQN的完全相同D、Double DQN引入了优势函数(advantage function)

微信扫码免费搜题