A.忽略长期依赖B.仅考虑最近的信息C.使用特殊的架构D.人工设置时间限制
A.增加训练轮次B.使用梯度裁剪C.使用循环神经网络D.使用更大的批量大小
A.增加层数B.减少层数C.使用浅层网络D.不使用层次结构