
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
字符串对象方法正则表达式re库
前言 简单介绍各种机器学习算法的优缺点,和用python中的一些相关库的用法一、监督学习算法1、k-NN近邻1.1 简介 k-NN 算法可以说是最简单的机器学习算法。构建模型只需要保存训练数据集即可。想要对新数据点做出预测,算法会在训练数据集中找到最近的数据点,也就是它的“最近邻”。 主要过程为:1. 计算训练样本和测试样本中每个样本点的距离(常见的距离度量有欧式距离,马氏距离等);2. 对上面
将连续数据进行离散化常用的有两种方式:等宽法和等频法。
前言 简单介绍各种机器学习算法的优缺点,和用python中的一些相关库的用法一、监督学习算法1、k-NN近邻1.1 简介 k-NN 算法可以说是最简单的机器学习算法。构建模型只需要保存训练数据集即可。想要对新数据点做出预测,算法会在训练数据集中找到最近的数据点,也就是它的“最近邻”。 主要过程为:1. 计算训练样本和测试样本中每个样本点的距离(常见的距离度量有欧式距离,马氏距离等);2. 对上面
本文介绍pandas中几种常用的汇总和计算描述统计
数据分析思维——数据分析方法
一、简介 线性回归模型是一种很常见、很常用的模型,下面我们简单介绍一下。二、介绍2.1 模型 线性回归模型的表达式为:Y=Xβ+ε(1)Y = X\beta + \varepsilon\tag1Y=Xβ+ε(1)其中,Y=(y1,y2,⋯ ,yn)TY = (y_1, y_2, \cdots, y_n)^TY=(y1,y2,⋯,yn)T, β=(β0,β1,⋯ ,βp−1)T\beta=(\
一、背景统计量的引入是为了简化样本的繁杂,但所使用的统计量是否把样本中关于感兴趣问题的信息全部吸收进来了?这就引出充分统计量的概念。它是Fisher正式提出的,其思想源于他和Eddington关于估计标准差的争论。二、定义对于某分布族F={Fθ(x):θ∈Θ}\mathcal F=\{F_\theta(x):\theta\in\Theta\}F={Fθ(x):θ∈Θ},∀F∈F\forallF\
用蒲丰(buffon)投针来估计π
数据分析思维——数据分析方法







