logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

机器学习系列(1)_数据分析之Kaggle泰坦尼克之灾

本篇博客通过分析泰坦尼克号事故中幸存者与遇难者的名单,从而得出一些相关关系的判断,并且使用可视化的手段更加具体的展现。import seaborn as snsimport numpy as npimport pandas as pdimport matplotlib as mplimport matplotlib.pyplot as plt%matplotlib inlineplt.rcPara

#数据分析#机器学习#深度学习 +2
机器学习系列(13)_PCA对图像数据集的降维_02

文章目录一、降维究竟是怎样实现的二维特征矩阵降维的一般过程PCA降维与特征选择的不同:重要参数n_components迷你案例:高维数据的可视化6、探索降维后的数据最大似然估计自选超参数按信息量占比选超参数1、一、降维究竟是怎样实现的【1】降维:减少特征,删除数据,模型受影响【2】噪音:【3】PCA使用样本方差二维特征矩阵降维的一般过程过程二维特征矩阵n维特征矩阵1输入原数据,结构为(2,3)23

#机器学习#人工智能#支持向量机
数据库——多种方法导入Excel数据

文章目录一、SQL Server导入Excel数据二、小技巧导入Excel数据三、使用Microsoft.ACE.OLEDB导入Excel数据四、手动添加一行数据五、手动添加多行数据五、解决类型不匹配致导入失败一、SQL Server导入Excel数据接下来就一直点击NEXT,直到完成此时EXCEL的数据就被导入进SQL Server了:二、小技巧导入Excel数据这个技巧就是直接使用复制粘贴的方

#数据库
机器学习系列(7)_决策树与随机森林概念

注:本篇博客参考 b站:机器学习经典算法(2)——决策树与随机森林文章目录一、熵与基尼系数二、决策树构造实例三、信息增益(ID3算法)四、信息增益率(C4.5算法)五、二分选值六、决策树减枝七、随机森林决策树有三种算法:一、熵与基尼系数熵:一件事情的混乱程度如果一个集合内部的属性很多,混乱程度就很大,则熵值也较大如果一个集合内部的属性很少,混乱程度就很小,则熵值也较小基尼系数和熵在公式上面不同,但

#机器学习#随机森林#决策树
机器学习系列(5)_特征工程02特征提取

文章目录#数据预处理,特征选择的目的是改善数据质量,体现数据的本质特征,降低计算成本,提升模型的表现。特征选择–主要分为三个模块:特征提取(Features Extraction):如从文本型数据提取日期型数据;从非结构化数据(文本,视频,音频等)提取数据。如:Web爬取等;特征创建(Features Creation):通过组合,计算等方法,得到原本不存在的特征(必须是合理的);特征选择(Fea

#机器学习#sklearn
机器学习系列(6)_特征工程03碳排放小案例

文章目录一、归一化处理import numpy as npimport pandas as pdfrom scipy.cluster.vq import *import matplotlib.pyplot as pltfrom sklearn.manifold import TSNEfrom scipy.spatial.distance import cdistfrom matplotlib.ti

#python#机器学习
机器学习系列(8)_回归算法,支持向量机

注:本篇文章参考:b站:机器学习经典算法——回归算法文章目录一、机器学习简介二、回归算法三、支持向量机要解决的问题四、支持向量机求解目标五、核函数变换一、机器学习简介机器学习应用的领域非常广泛:数据挖掘:分析用户信息,提高用户对产品的依赖性。计算机视觉:无人驾驶汽车–实时进行检测任务机器学习的步骤:1、训练样本2、特征提取(数据科学家:知道一份数据如何是机器能更好的识别特征)3、学习函数4、预测N

#机器学习
机器学习系列(16)_朴素贝叶斯算法

注:机器学习之分类<朴素贝叶斯>期末会有一道贝叶斯的计算的题目文章目录一、1、计算题2、一、朴素贝叶斯是一种直接衡量标签和特征之间的概率关系的有监督算法。1、计算题2、#快速体验import numpy as npfrom sklearn.naive_bayes import GaussianNBX = np.array([[-1, -1], [-2, -2], [-3, -3], [

#机器学习#算法#概率论
机器学习系列(2)_数据分析之Kaggle电影TMDB5000

文章目录一、数据整理1. 电影类型随时间变化怎么样?2. 电影类型与利润的关系3. 电影的投入与利润的关系4. Universal和Paramount两家影视公司的对比情况如何?5. 改编电影和原创电影以及评分情况如何6. 电影时长与电影票房以及评分的关系7. 分析电影关键字8.分析演员的关联度(社会网络计算)9.分析演员的词云一、数据整理budget:电影成本genres:风格列表,按|分隔,最

#机器学习#数据挖掘
机器学习系列(1)_数据分析之Kaggle泰坦尼克之灾

本篇博客通过分析泰坦尼克号事故中幸存者与遇难者的名单,从而得出一些相关关系的判断,并且使用可视化的手段更加具体的展现。import seaborn as snsimport numpy as npimport pandas as pdimport matplotlib as mplimport matplotlib.pyplot as plt%matplotlib inlineplt.rcPara

#数据分析#机器学习#深度学习 +2
    共 48 条
  • 1
  • 2
  • 3
  • 4
  • 5
  • 请选择