logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【20211106】【数据分析】hist 和 bar 的区别

hist 和 bar 的区别为:意义不同、创建图形不同、参数不同、正则化不同。一、意义不同1. hist 是画(频率分布)直方图,x 轴表示这一列数据的种类,y 轴表示该类别出现的次数(频数);bar 是画柱状图。2. hist 直方图展示的是数据的分布,bar 柱状图展示的数据本身的大小。二、创建的图形不同1. hist 是用来创建一个直方图的 matplotlib 函数;2. bar 是用来创

#python#开发语言#后端
【20210914】【机器/深度学习】一种非线性降维的手段——manifold learning流形学习

一、背景高维数据不像 2-3 维数据那么容易可视化,它很难通过图表展示数据本身的内部结构。所以为了实现数据集结构的可视化,数据的维度必须通过某种方式降维。二、常用的降维手段一系列监督或非监督的线性降维框架,如:Principal Component Analysis(PCA, 主成分分析)、Independent Component Analysis(独立成分分析)、Linear Discrimi

#深度学习#机器学习
【20210911】【机器/深度学习】Cart决策树、lightGBM模型训练阶段小结

一、背景问题源于工作中的一项分类任务,正负样本比例严重失衡,想使用 lgb 实现二分类算法。二、读取样本集(.mat格式的数据)import scipy.io as scioimport pandas as pddata_dict = scio.loadmat('样本集.mat')# scio.loadmat()读出来的数据是dict格式data_narray = data_dict['data'

#深度学习#机器学习#人工智能
【20210910】【机器/深度学习】lightGBM模型训练中报错:“Cannot set reference after freed raw data“

一、原因在于:lightGBM模型训练完之后,Dataset的数据就会被清空,虽然在变量中它还存在,但实际已经被清空了,所以要再使用的话,需要重新生成!二、补充知识点:lightGBM 模型训练时,输入的数据类型是 Dataset 格式,所以需要用 lgb.Dataset() 先进行格式转换!...

#python#深度学习#机器学习
【20210922】【机器/深度学习】机器学习算法分类

一、按学习方式划分1. 监督学习监督学习是指从给定的训练数据集中学习出一个函数(模型参数),当新的数据到来时,可以根据这个函数预测结果。监督学习的训练集要求包括输入输出,即特征和标签。数据集中每个样本都有相应的 “正确答案(标签)”,根据这些样本做出预测。所有的分类和回归算法都属于监督学习。回归和分类算法的区别在于输出变量的类型:定量输出称为回归(连续型、数值型变量预测)、定性输出称为分类(离散变

#算法#机器学习#自动驾驶
【20210913】【数据库】用SQL语句,往数据库里插入一行、多行新数据

1. 插入一行数据insert into table_name (field1, field2, ..., fieldN) values (value1, value2, ..., valueN)(参考:MySQL 插入数据)2. 插入多行数据insert into table_name (field1, field2, ..., fieldN)values(value11, value12, .

#sql#big data#数据库
【20210723】【机器/深度学习】“基于特征工程完成对贷款数据集Lending Club的预处理” 学习笔记

学习链接:https://work.datafountain.cn/forum?id=79&type=2&source=1相关知识点:数据预处理特征工程特征工程基本流程python 相关库函数(pandas, numpy 等)在机器学习领域,有这样一句话:“数据和特征决定了机器学习算法的上限,而模型和算法只是不断逼近这个上限而...

【20210922】【机器/深度学习】机器学习算法分类

一、按学习方式划分1. 监督学习监督学习是指从给定的训练数据集中学习出一个函数(模型参数),当新的数据到来时,可以根据这个函数预测结果。监督学习的训练集要求包括输入输出,即特征和标签。数据集中每个样本都有相应的 “正确答案(标签)”,根据这些样本做出预测。所有的分类和回归算法都属于监督学习。回归和分类算法的区别在于输出变量的类型:定量输出称为回归(连续型、数值型变量预测)、定性输出称为分类(离散变

#算法#机器学习#自动驾驶
【20210914】【机器/深度学习】详解鸢尾花卉数据集,并以此为例介绍决策树模型的保存与调用

一、鸢尾花卉数据集(Iris数据集)1. 数据集介绍Iris数据集是一种多重变量分析的数据集,数据集包含150个数据样本,分为3类,每类有50个数据,每个数据包含4个属性/特征,分别是:花萼长度、花萼宽度、花瓣长度、花瓣宽度,标签有3个,分别是:Setosa, Versicolour, Virginca。(参考:IRIS (IRIS数据集))2. 数据集调用和可视化from sklearn.dat

#决策树#深度学习#机器学习
    共 52 条
  • 1
  • 2
  • 3
  • 6
  • 请选择