【Deep Learning】第7章 深度学习中的正则化
第7章 深度学习中的正则化
参数范数惩罚
正则化后的目标函数$\tilde{J}(\theta;X,y)=J(\theta;X,y)+\alpha\Omega(\theta)$
其中$\alpha\in [0,\infty)$是权衡范数惩罚项$\Omega$和标准目标函数$J$相对贡献的超参数
最小化正则化后的目标函数$\tilde{J}$会降低标准目标$J$关于测试集的误差并减小在某些衡量标准下参数子集$\theta$的规模
神经网络中,参数包括每一层仿射变换的权重和偏置,通常只对权重做正则惩罚,不对偏...