1
hamhamham 2021-11-16 02:00:35 +08:00
1. 不会对最终模型精度有影响
2. 我的理解:没用到的层不是计算图的一部分。就算你把他的参数加入 optimizer 里面,也会因为梯度全部为 0 无法更新参数,相当于不参加反向传播。 |
2
Xs0ul 2021-11-16 04:23:46 +08:00
目测是新加的层影响了随机的初始化
|
3
flyaway 2021-11-16 05:01:00 +08:00
1 楼+1 没参与到 computation graph 不应该有影响
|