首页
题库
网课
在线模考
搜标题
搜题干
搜选项
问答题
以下哪种方法常用于解决深度强化学习中的探索与利用权衡问题?
答案:
A.汤普森采样
B.上置信界算法
C.ε-贪婪策略
D.以上都是
正确答案:D
答案解析:汤普森采样、上置信界算法和ε-贪婪策略都常用于解决探索与利用权衡问题。
点击查看答案
你可能感兴趣的试题
问答题
在自然语言生成任务中,以下哪种方法可以提高生成文本的连贯性?
答案:
A.引入主题模型
B.使用束搜索
C.增加层数
D.减少神经元数量
正确答案:B
答案解析:使用束搜索可以提高生成文本的连贯性。
点击查看答案
问答题
以下哪种技术可以使深度神经网络对输入的微小扰动具有鲁棒性?
答案:
A.对抗训练
B.模型融合
C.超参数调整
D.特征选择
正确答案:A
答案解析:对抗训练可使深度神经网络对输入扰动更鲁棒。
点击查看答案
问答题
对于强化学习中的连续控制问题,以下哪种算法通常被采用?
答案:
A.DQN
B.A2C
C.DDPG
D.SARSA
正确答案:C
答案解析:DDPG通常用于强化学习中的连续控制问题。
点击查看答案
问答题
以下哪种模型架构在处理大规模图像数据集时表现出色,且具有较高的计算效率?
答案:
A.ResNet
B.VGG
C.AlexNet
D.GoogLeNet
正确答案:A
答案解析:ResNet在处理大规模图像数据集时表现出色且计算效率较高。
点击查看答案
问答题
在自然语言处理中,使用预训练语言模型进行微调时,以下哪种策略可能导致灾难性遗忘?
答案:
A.随机初始化微调层
B.固定预训练模型的部分参数
C.完全重新训练所有参数
D.逐渐减少学习率
正确答案:C
答案解析:完全重新训练所有参数可能导致灾难性遗忘。
点击查看答案