欠拟合（Underfitting），过拟合，你猜不出他是谁！

老王博客

2年前发布
关注私信

030

欠拟合，过拟合

欠拟合意味着特征数量太少而无法很好地描述数据。

过拟合是指选择的特征太多，也不能很好地描述数据。

我们以猜星为例：

他有2个耳朵。这太不合适了，你猜不到他是谁！他看起来像一只斗牛梗。这只是一个合适的，你可能已经猜到他是谁了。长得像王宝强。这是过拟合。特征太具体太笼统，你还是猜不出来他是谁。

回到数学，让我们举个数学例子机器学习防止过拟合，假设我们要拟合 -x² 并使用左侧 60% 的数据进行训练。

以下是欠拟合的示例机器学习防止过拟合，使用 1 次（线性）多项式来拟合训练数据。

下面是一个刚刚拟合的例子，使用二次多项式来拟合训练数据。

下面是一个过拟合的例子，使用11次多项式来拟合数据。

那么，我们如何防止过拟合呢？

简而言之，我们希望模型在所有数据上都表现良好。

在机器学习中，我们常用的方法是在成本函数中添加正则项或惩罚因子。L2 范数是常用的（范式将在后面讨论）。简单的理解是参数的平方和。参数越多，惩罚越严重。，这相当于添加了一个先验项。

优化 = 成本函数（误差项）+ 正则化项（惩罚因子）

彩蛋：和贝叶斯原理一样吗！！！

下图是加了平方和的惩罚项对应的最简单的表达式拟合误差。您可以看到最佳拟合是二次多项式。

当然，还有另一种更现实的方法。比较训练组和测试组的误差项的值，选择最小的一个。

本文中使用的技术

（如果有启发，请[观看]支持，谢谢！）

© 版权声明

文章版权声明 1、本站永久网址：https://www.9im.cn
2、本主题所有言论和图片纯属会员个人意见，与本网站立场无关。
3、本网站所有源码和软件均为作者提供和网友推荐收集整理而来，对提供的源码不拥有任何权利，其版权归原著者拥有。仅供学习和研究使用,下载后请24小时内删除。不得使用于非法商业用途，不得经营非法游戏或违反国家法律。一切关于该资源商业行为与老王博客无关。
4、如果您喜欢该程序，请支持正版源码、软件，购买注册，得到更好的正版服务。如有侵犯你版权的，请邮件与我们联系处理，本站将立即改正。
5、本站资源大多存储在云盘，如发现链接失效，请联系我们我们会第一时间更新。

THE END

喜欢就支持一下吧

评论抢沙发

请登录后发表评论