机器学习——多项式曲线拟合及Python代码实现

线性回归是回归问题，此方法对训练数据类型没有要求，可以是离散特征，也可以是连续特征；此方法会出现过拟合问题，在处理过拟合手段就是降低模型难度，减少特征个数，或者采用正则化方法，就是在损失函数后面加上正则项（l1、l2正则项）。此方法也会出现欠拟合问题。处理手工增加新的特征变量，也可以增加多项式特征，使模型更加complex,实现非线性回归。

泡泡怡

2334人浏览 · 2022-09-19 20:33:43

泡泡怡 · 2022-09-19 20:33:43 发布

一、回归模型评价指标说明

二、线性回归

三、Python代码实现

（1）导包

import matplotlib.pyplot as plt
import numpy as np
from sklearn.datasets import load_boston
from sklearn.preprocessing import StandardScaler
from sklearn.metrics import classification_report
from sklearn.metrics import r2_score,mean_squared_error,mean_absolute_error

（2）下载数据集（从sklearnz中下载）

boston=load_boston()
X=boston.data
y=boston.target

X：代表所有特征；y:代表所有label

（3）划分数据集（test_size=0.2：将数据的80%划分为训练集，20%划分为测试集）

from sklearn.model_selection import train_test_split
X_train,X_test,y_train,y_test=train_test_split(X,y,test_size=0.2,random_state=3)

（4）数据标准化（归一化，去除量纲）

ss=StandardScaler()
X_train=ss.fit_transform(X_train)
X_test=ss.transform(X_test)

（5）训练模型（导入线性训练器）

from sklearn.linear_model import LinearRegression
model=LinearRegression()
model.fit(X_train,y_train)

(6)模型评估

train_score=model.score(X_train,y_train)#训练集得分
test_score=model.score(X_test,y_test)#测试集得分
print('train_score:',train_score)
print('test_score:',test_score)

结果：

我们会发现训练结果欠拟合。

我们还可以看一下MAE、MSE

mse=mean_squared_error(y_test,y_test_predict)
print('The value of mse:',mse)
mae=mean_absolute_error(y_test,y_test_predict)
print('The value of mae:',mae)

结果：

（7）模型优化

1.导入多项式包

from sklearn.preprocessing import PolynomialFeatures

2.传入degree的数值，比如等于2，则代表2次多项式

polynomial_features=PolynomialFeatures(degree=2)
X_train1=polynomial_features.fit_transform(X_train)
X_test1=polynomial_features.fit_transform(X_test)

3.模型训练

model=LinearRegression()
model.fit(X_train1,y_train)

4.模型评估

train_score = model.score(X_train1, y_train)
test_score = model.score(X_test1, y_test)
print('train_score：','R2=',train_score)
print('test_score=：','R2=',test_score)

结果：

（8）权重系数

model.coef_

亚马逊云科技技术品牌专区

更多推荐

STM32节点移植lorawan协议连接腾讯云物联网开发平台（IoT Explorer）

STM32移植lorawan协议连接腾讯云物联网开发平台（IoT Explorer）前言前言在移植协议之前，先给大家科普一下Lora 和 lorawan 的区别。LoRa 是LPWAN通信技术中的一种，是美国Semtech公司采用和推广的一种基于扩频技术的超远距离无线传输方案。这一方案改变了以往关于传输距离与功耗的折衷考虑方式为用户提供一种简单的能实现远距离、长电池寿命、大容量的系统，进而扩...

亚马逊云科技技术品牌专区

物联网主机E6000引领工业自动化的新篇章

亚马逊云科技技术品牌专区

搞 IoT 物联网，你居然要懂这么多种协议...

物联网协议是指在物联网环境中用于设备间通信和数据传输的协议。根据不同的作用，物联网协议可分为传输协议、通信协议和行业协议。传输协议：一般负责子网内设备间的组网及通信。例如 Wi-Fi、Ethernet、NFC、 Zigbee、Bluetooth、GPRS、3G/4G/5G等。这些协议能够确保在网络上传输的数据的安全性和可靠性。通讯协议：主要是运行在传统互联网TCP/IP协议之上的设备通讯协议，负责