logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

机器学习系列(1)_数据分析之Kaggle泰坦尼克之灾

本篇博客通过分析泰坦尼克号事故中幸存者与遇难者的名单,从而得出一些相关关系的判断,并且使用可视化的手段更加具体的展现。import seaborn as snsimport numpy as npimport pandas as pdimport matplotlib as mplimport matplotlib.pyplot as plt%matplotlib inlineplt.rcPara

#数据分析#机器学习#深度学习 +2
机器学习系列(13)_PCA对图像数据集的降维_02

文章目录一、降维究竟是怎样实现的二维特征矩阵降维的一般过程PCA降维与特征选择的不同:重要参数n_components迷你案例:高维数据的可视化6、探索降维后的数据最大似然估计自选超参数按信息量占比选超参数1、一、降维究竟是怎样实现的【1】降维:减少特征,删除数据,模型受影响【2】噪音:【3】PCA使用样本方差二维特征矩阵降维的一般过程过程二维特征矩阵n维特征矩阵1输入原数据,结构为(2,3)23

#机器学习#人工智能#支持向量机
数据库——多种方法导入Excel数据

文章目录一、SQL Server导入Excel数据二、小技巧导入Excel数据三、使用Microsoft.ACE.OLEDB导入Excel数据四、手动添加一行数据五、手动添加多行数据五、解决类型不匹配致导入失败一、SQL Server导入Excel数据接下来就一直点击NEXT,直到完成此时EXCEL的数据就被导入进SQL Server了:二、小技巧导入Excel数据这个技巧就是直接使用复制粘贴的方

#数据库
Python数据特征分析_02(相关系数,帕累托定律,周期性)

本篇博客主要以员工贡献度为例,分析不同菜品之间是否存在相关性。最典型的应用就是:啤酒和尿布销售之间的联系文章目录一、周期性分析二、贡献性分析三、相关性分析1、探究不同菜品之间的相关性2、探究不同学生之间的相关性一、周期性分析探索某个变量是否随着时间变化而呈现出某种周期性变化的趋势。时间尺度相对较长的周期性趋势有:年度周期性趋势,季节性周期性趋势,相对较短的有月度周期性趋势,周度周期性趋势,甚至更短

#python
机器学习系列(8)_回归算法,支持向量机

注:本篇文章参考:b站:机器学习经典算法——回归算法文章目录一、机器学习简介二、回归算法三、支持向量机要解决的问题四、支持向量机求解目标五、核函数变换一、机器学习简介机器学习应用的领域非常广泛:数据挖掘:分析用户信息,提高用户对产品的依赖性。计算机视觉:无人驾驶汽车–实时进行检测任务机器学习的步骤:1、训练样本2、特征提取(数据科学家:知道一份数据如何是机器能更好的识别特征)3、学习函数4、预测N

#机器学习
机器学习系列(1)_数据分析之Kaggle泰坦尼克之灾

本篇博客通过分析泰坦尼克号事故中幸存者与遇难者的名单,从而得出一些相关关系的判断,并且使用可视化的手段更加具体的展现。import seaborn as snsimport numpy as npimport pandas as pdimport matplotlib as mplimport matplotlib.pyplot as plt%matplotlib inlineplt.rcPara

#数据分析#机器学习#深度学习 +2
机器学习系列(6)_特征工程03碳排放小案例

文章目录一、归一化处理import numpy as npimport pandas as pdfrom scipy.cluster.vq import *import matplotlib.pyplot as pltfrom sklearn.manifold import TSNEfrom scipy.spatial.distance import cdistfrom matplotlib.ti

#python#机器学习
2022华数杯B题论文思路分析+完整代码(水下机器人组装计划)

2022华数杯B题优秀论文思路分析+完整代码1.用于组装小组件的材料充足。2.生产过程中,不会因为工厂停电、机械故障等突发情况打断生产。3.工厂资金流正常,不会因为缺乏资金而影响生产。4.只有最终产品机器人有外部需求,其他组件不对外销售。5.机器人的需求按计划而定,不受市场价格波动的影响。此处以组装大组件A为例。组装一个大组件A,需要6个小组件A1,8个小组件A2,2个小组件A3。在第d天时,..

文章图片
#算法#人工智能
机器学习系列(10)_决策树与随机森林回归

文章目录一、决策树优缺点二、泰坦尼克号幸存者案例一、决策树优缺点(1)优点:易于理解;数据的预处理工作可以较少;使用树的成本比如预测数据的时候,对于训练树的数据点往往使用的是数量的对数;能够同时处理数值和分类数据‘处理多输出的问题;属于易于理解的白盒模型;可通过统计测试试验模型;(2)缺点:如果树过于复杂,即过拟合,导致不能很好的推广;可能不稳定;基于贪婪算法;二、泰坦尼克号幸存者案例【1】导入库

#决策树#机器学习#随机森林
机器学习系列(11)_决策树挖掘NBA冠军球队数据

导入NBA数据,我放在我的gitee里面,需要的朋友点击文章最上面的链接自取。NBA数据的属性如下:共27个特征,718条数据。这27个特征中有一些特征不重要,因此我们只选取一些较为重要的参数。根据这些参数进行分析,然后预测一些球队得冠军的概率有多高。定义我们需要的特征:有六条数据中三分球的得分为0,这可能会对最终的数据造成影响。由于含有694个空值,因此我们需要将空值变成0在对数据有了大概的处理

#决策树#python
    共 27 条
  • 1
  • 2
  • 3
  • 请选择