logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

数据预处理——one-hot编码

如果侵权,可联系博主前言————————————————————————————————————————在机器学习算法中,我们经常会遇到分类特征,例如:人的性别有男女,祖国有中国,美国,法国等。这些特征值并不是连续的,而是离散的,无序的。通常我们需要对其进行特征数字化。那什么是特征数字化呢?例子如下:性别特征:[“男”,“女”]祖国特征:[“中国”,"美国,“法国”]运动特征:[“...

统计机器学习【1】- 入门机器学习(三)- 精确率P与召回率R

首先还是讲讲TP,FN,FP,TN先:TP——将正类预测为正类数;TP——将正类预测为正类数;TP——将正类预测为正类数;FN——将正类预测为负类数;FN——将正类预测为负类数;FN——将正类预测为负类数;FP——将负类预测为正类数;FP——将负类预测为正类数;FP——将负类预测为正类数;TN——将负类预测为负类数;TN——将负类预测为负类数;TN——将负类预测为负类数;对于上面的我们可以这样理解

统计机器学习【3】- K近邻法(三)Ball Tree

在计算机科学中,球树(ball tree)是一种空间划分数据结构,用于组织在多维空间中的点。球数之所有得到此名,是因为它将数据点划分为一组嵌套的超球体。这种类型的数据结构特征使其在很多方面都有用,特别是在最近邻搜索。一般的在特征向量维度小于20的时候是可以用KD-Tree的,但是更高维度的时候建议使用Ball-Tree,这种算法的效率更高非正式描述球树是二叉树,其中每个结点定义一个d维的超球面,或

机器学习算法准备提升——线性模型(2)【贝叶斯回归】

记录一下学习笔记,这些公式用markdown打起来太费时间了,哈哈,就改成了这种方式记录笔记。参考资料:【1】机器学习-白板推导系列(十九)-贝叶斯线性回归(Bayesian Linear Regression)【2】Bayesian linear regression【3】Bayes’ theorem...

机器学习算法面试题——最近邻算法【KNN】(一)

(1)写出KNN的公式:给定训练数据集:T={(x1,y1),(x2,y2),...,(xN,yN)}T = \{(x_1, y_1), (x_2, y_2),..., (x_N, y_N)\}T={(x1​,y1​),(x2​,y2​),...,(xN​,yN​)}其中,xi∈χ⊆Rnx_i \in \chi \subseteq R^nxi​∈χ⊆Rn为实例的特征向量,yi∈γ={c1,c2,.

机器学习算法面试题——聚类算法

【1】当数据缺失时怎么处理,除了直接舍去还有什么方法。如何使用聚类算法去填补缺失值。答:对于缺失值较多的特征处理:我们直接将该特征弃掉,否则可能反倒会带入较大的noist,对结果造成不良影响。对于缺失值较少的特征处理:(1)把缺失值用一个数值,例如0表示;(2)均值,中值,分位数、众数,随机数,上下数据填充,插值法;(3)用算法拟合进行填充;对于如何使用聚类算法去填补缺失值,我想到的是用KNN方法

机器学习算法面试题——聚类算法

【1】当数据缺失时怎么处理,除了直接舍去还有什么方法。如何使用聚类算法去填补缺失值。答:对于缺失值较多的特征处理:我们直接将该特征弃掉,否则可能反倒会带入较大的noist,对结果造成不良影响。对于缺失值较少的特征处理:(1)把缺失值用一个数值,例如0表示;(2)均值,中值,分位数、众数,随机数,上下数据填充,插值法;(3)用算法拟合进行填充;对于如何使用聚类算法去填补缺失值,我想到的是用KNN方法

机器学习算法准备提升——线性模型(2)【贝叶斯回归】

记录一下学习笔记,这些公式用markdown打起来太费时间了,哈哈,就改成了这种方式记录笔记。参考资料:【1】机器学习-白板推导系列(十九)-贝叶斯线性回归(Bayesian Linear Regression)【2】Bayesian linear regression【3】Bayes’ theorem...

统计机器学习【3】- K近邻法(三)Ball Tree

在计算机科学中,球树(ball tree)是一种空间划分数据结构,用于组织在多维空间中的点。球数之所有得到此名,是因为它将数据点划分为一组嵌套的超球体。这种类型的数据结构特征使其在很多方面都有用,特别是在最近邻搜索。一般的在特征向量维度小于20的时候是可以用KD-Tree的,但是更高维度的时候建议使用Ball-Tree,这种算法的效率更高非正式描述球树是二叉树,其中每个结点定义一个d维的超球面,或

Python中的absl库的应用

一、Abseil Python命令库这个absl库是建立Python应用的python代码集合。这些代码是从Google自己的Python代码基础上收集来的,被用于测试和工业中。(1)特点:简单的应用创建分布式命令行标志系统用户自定义模块和附加特征测试工具(2)如何开始安装为了安装这个库,简单运行下面代码:pip install absl-py二、一个实例#"""ab...

    共 11 条
  • 1
  • 2
  • 请选择