简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
Python机器学习一、机器学习的三种不同方法监督学习:用有类标(label)的训练数据构建模型。所谓类标即已知输出项,也就是我们知道该训练样本的输出是什么,而我们所做的是用已知的样本去训练机器,最终让机器获得预测未知数据的能力。分类:将离散化的样本按其特征划分到不同类别中,先训练找到分界线后机器在输入新样本时即可实现新样本的分类回归:针对连续性输入变量进行预测,先训练找到输入和输出的关系,然后机
文章目录前言一、数据导入与查看二、数据操作三、可视化1.显示两个特征的关系2.热力图前言对于数据处理,我们可以运用python的一些库来完成和实现,下面是一些常用的程序代码总结一、数据导入与查看这里的数据集名称为data0.导入APIimport pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport seaborn
一.读取数据1.读取本地数据data= pd.read_csv("文件路径\文件名.后缀名")2.读取科学库中数据sklearn中提供了许多简单数据集,以iris为例,需要导入APIfrom sklearn.datasets import load_irisdata = load_iris()二,数据提取1.在读取数据后,输入data.shape(),可查看数据集的形状,根据需要进行数据分片。da
逻辑回归逻辑回归(Logistic Regression)是机器学习中的一种分类模型,逻辑回归是一种分类算法,虽然名字中带有回归。由于算法的简单和高效,在实际中应用非常广泛。逻辑回归是解决二分类问题的利器。逻辑回归的输入就是一个线性回归的结果。sigmoid函数回归的结果输入到sigmoid函数当中输出结果:[0, 1]区间中的一个概率值,默认为0.5为阈值APIsklearn.linear_mo
0.磁盘分区我的电脑——右键——管理——磁盘管理选择一个盘(安装Ubuntu,我选的是F盘)——右键——压缩卷——选择压缩大小(20G以上)1.Ubuntu安装包下载**方法一:**官网下载20.04最新版本URL:https://ubuntu.com/**方法二:**如果方法一速度太慢,则可选择国内镜像网站,这里推荐清华大学开源软件镜像站:URL:https://mirrors.tuna.tsi
目录数据集读取数据提取数据合并编码One-Hot编码标签编码分箱归一化与标准化归一化标准化处理缺失值判断缺失值是否存在处理缺失值数据集划分PAC降维简单可视化例子在训练机器学和深度学习模型时,都需要数据作为支持,数据可看作一个矩阵,行为数据个数,列为数据特征。在有监督学习中,某一列特征为目标值,无监督学习则没有,下面介绍几种常见的数据处理方法下面以简单的iris数据集为例:数据集读取from sk