A.信息熵不同B.构成新概率空间C.信息熵不变D.不可能有多种划分
A.创建网络B.损失函数最小化C.梯度下降过程LOSS最小化D.数据清洗
A.准备样本集合B.前向传递,求出lossC.求出反向的梯度dYD.按照梯度dY,确定的更新参数,更新X,继续循环