【扫盲】机器学习中模型的容量、表示容量、有效容量

我们训练机器学习模型时，可以选择训练集来拟合目标函数，降低训练误差，并缩小训练误差和测试误差的差距（欠拟合和过拟合）。模型的容量(capacity)从本质上说是描述了整个模型的拟合能力的大小。容量低的模型可能在训练集上就会很难拟合目标函数，产生而欠拟合；容量高的模型或许会在训练集上可以很好的拟合目标函数，而不具备一定的泛化能力，导致过拟合。增加模型容量的方法有很多，比如我们使用线性回归函数来拟合一

Dust_Evc

3250人浏览 · 2022-03-30 23:00:55

Dust_Evc · 2022-03-30 23:00:55 发布

我们训练机器学习模型时，可以选择训练集来拟合目标函数，降低训练误差，并缩小训练误差和测试误差的差距（欠拟合和过拟合）。

模型的容量(capacity)从本质上说是描述了整个模型的拟合能力的大小。容量低的模型可能在训练集上就会很难拟合目标函数，产生而欠拟合；容量高的模型或许会在训练集上可以很好的拟合目标函数，而不具备一定的泛化能力，导致过拟合。

增加模型容量的方法有很多，比如我们使用线性回归函数来拟合一个线性函数，就可以通过增加参数高次幂的方法来增加模型容量，一个5次多项式（包含从1到5次幂以及常数项）的模型就比二次多项式的模型容量要高。但是如果我们要拟合的是一个三次函数，用二次多项式的模型就会导致欠拟合，用5次多项式就可能会导致过拟合。

表示容量(representational capacity)：模型的最大容量。指的是通过调节参数降低训练目标时，学习算法可以从哪些函数族中选择函数。

有效容量(effective capacity)：在实际训练机器学习模型中，从表示容量中选择最优函数是非常困难的，比如我们要拟合一个三次函数，而我们选择的容量中可能包括四次多项式，其实有效容量里是没有四次幂的。实际上我们训练出来的模型只是一个可以大大降低训练误差的函数，并不可能完美，也就说学习算法的有效容量，可能会小于模型的表示容量。

亚马逊云科技技术品牌专区

更多推荐

STM32节点移植lorawan协议连接腾讯云物联网开发平台（IoT Explorer）

STM32移植lorawan协议连接腾讯云物联网开发平台（IoT Explorer）前言前言在移植协议之前，先给大家科普一下Lora 和 lorawan 的区别。LoRa 是LPWAN通信技术中的一种，是美国Semtech公司采用和推广的一种基于扩频技术的超远距离无线传输方案。这一方案改变了以往关于传输距离与功耗的折衷考虑方式为用户提供一种简单的能实现远距离、长电池寿命、大容量的系统，进而扩...

亚马逊云科技技术品牌专区

物联网主机E6000引领工业自动化的新篇章

亚马逊云科技技术品牌专区

搞 IoT 物联网，你居然要懂这么多种协议...

物联网协议是指在物联网环境中用于设备间通信和数据传输的协议。根据不同的作用，物联网协议可分为传输协议、通信协议和行业协议。传输协议：一般负责子网内设备间的组网及通信。例如 Wi-Fi、Ethernet、NFC、 Zigbee、Bluetooth、GPRS、3G/4G/5G等。这些协议能够确保在网络上传输的数据的安全性和可靠性。通讯协议：主要是运行在传统互联网TCP/IP协议之上的设备通讯协议，负责