单项选择题

prefix LM和casual LM的主要区别在于（）

A.模型结构不同
B.训练数据不同
C.attention mask不同
D.生成策略不同

你可能感兴趣的试题

单项选择题

RLHF流程的第一步是（）

A.使用函数/模型/人类反馈评估问题和答案
B.语言模型根据问题生成答案或续写
C.在PPO优化步骤中计算序列中标记的对数概率
D.使用PPO算法训练语言模型

单项选择题

instruction tuning和prompt learning的主要区别在于（）

A.激发语言模型的补全能力
B.激发语言模型的理解能力
C.使用不同的训练数据
D.使用不同的模型架构