
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
将连续数据进行离散化常用的有两种方式:等宽法和等频法。
前言 简单介绍各种机器学习算法的优缺点,和用python中的一些相关库的用法一、监督学习算法1、k-NN近邻1.1 简介 k-NN 算法可以说是最简单的机器学习算法。构建模型只需要保存训练数据集即可。想要对新数据点做出预测,算法会在训练数据集中找到最近的数据点,也就是它的“最近邻”。 主要过程为:1. 计算训练样本和测试样本中每个样本点的距离(常见的距离度量有欧式距离,马氏距离等);2. 对上面
本文介绍pandas中几种常用的汇总和计算描述统计
数据分析思维——数据分析方法
一、简介 线性回归模型是一种很常见、很常用的模型,下面我们简单介绍一下。二、介绍2.1 模型 线性回归模型的表达式为:Y=Xβ+ε(1)Y = X\beta + \varepsilon\tag1Y=Xβ+ε(1)其中,Y=(y1,y2,⋯ ,yn)TY = (y_1, y_2, \cdots, y_n)^TY=(y1,y2,⋯,yn)T, β=(β0,β1,⋯ ,βp−1)T\beta=(\
一、背景统计量的引入是为了简化样本的繁杂,但所使用的统计量是否把样本中关于感兴趣问题的信息全部吸收进来了?这就引出充分统计量的概念。它是Fisher正式提出的,其思想源于他和Eddington关于估计标准差的争论。二、定义对于某分布族F={Fθ(x):θ∈Θ}\mathcal F=\{F_\theta(x):\theta\in\Theta\}F={Fθ(x):θ∈Θ},∀F∈F\forallF\
用蒲丰(buffon)投针来估计π
数据分析思维——数据分析方法
在数据源界面,可以连接两个表,并可以指定内/左/右连接和连接字段在数据源界面,可以通过点击字段上的 # 号更改字段的数据类型在数据源界面,可以通过 自定义拆分 将字段进行拆分,并得到一个新的字段,然后可以根据需要重命名维度是类别字段,度量是指标,是待分析的数据对于日期类数据,可以点击 + 号从年到季度再到月份,然后点击度量指标下拉键中的 快速表计算,可以计算同比右键单击图像可以给图像添加注释,复制
用户标签







