logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

特征工程之特征选择

1、过滤法方差过滤过滤法的主要对象:需要遍历特征或者升维的算法们(KNN,单棵决策树。支持向量机SVM、神经网络、回归算法)。因为他们需要遍历特征或者升维的特点,所以这些算法本身的运算量就很大,需要的时间就很长。因此方差过滤这样的特征选择对他们来说就尤为重要。但对于不需要遍历特征的算法,比如随机森林,它选取特征进行分枝,本身运算就非常快速,因此特征选择对它们来说效果平平。过滤法的主要目的:在维持算

#机器学习#人工智能
python抓取状态码418 | 豆瓣小王子评论抓取 |评分总和

场景:爬取豆瓣评论,状态码为418一、常见的HTTP状态码HTTP状态码的英文为HTTP Status Code。HTTP状态码共分为5种类型:常见的HTTP状态码:200 - 请求成功301 - 资源(网页等)被永久转移到其它URL404 - 请求的资源(网页等)不存在500 - 内部服务器错误(来源:https://www.runoob.com/http/http-status-codes.h

#python
深度学习与计算机视觉

semantic segmentation语义分割(不区分有几头牛,而是这一个区域都是牛)instance segmentation实例分割(相当于同时检测和分割)object detection 目标检测 (它不是分割,而是一个目标对象的框)语义分割多数时候需要进行后处理,将区域分割开感知机可以用简单的电路逻辑(与门、与非门、或门逻辑)实现,用感知机来表示电路逻辑,参数有无数多种选择把θ换成-b

#深度学习#计算机视觉#机器学习
机器学习四大编程语言对比:R、Python、Matlab、Octave

R 语言R 是一种用于统计计算和图的语言及环境。它是一个 GNU 项目,与贝尔实验室的 John Chambers 及其同事开发的 S 语言及环境类似。R 可以视为 S 的一种不同实现。二者存在一些重要差异,但使用 S 写的很多代码在 R 下运行时无需修改。优点:端到端开发到执行(一些 brokers package 允许执行,IB)开发速度快(比 Python 的代码少 60%)开源包多成熟的量

#机器学习
三蓝一棕 | 深度学习

其他知识的补充:最典型的MLP包括包括三层:输入层、隐藏层和输出层,MLP神经网络不同层之间是全连接的(全连接的意思就是:上一层的任何一个神经元与下一层的所有神经元都有连接)。神经网络主要有三个基本要素:权重、偏置和激活函数。权重告诉神经元需要关注什么样的像素图案。权重有点像连接的强弱。偏置告诉你加权和得有多大才能让神经元的激发变得有意义。而偏置值表示神经元是否更容易被激活。激活函数:起非线性映射

#深度学习
李沐《机器学习》——1.4数据标注

数据标注:当已经有一部分标注,可以使用半监督学习如果你的标志不够多, 但你有钱, 可以花钱去众包, 找人来标注.如果你的标注不够, 但你又没钱,可以自己从数据中提取出来弱一点的标准,进行弱监督学习再不行还可以选择无监督的算法半监督学习:想对有标注的数据和没有标注的数据一起使用的话,针对两者的数据分布之间有一些假设:连续性假设。 如果一个样本的特征和另一个样本相似的话,那么很有可能两者是同一标号。聚

#机器学习
深度学习与计算机视觉

semantic segmentation语义分割(不区分有几头牛,而是这一个区域都是牛)instance segmentation实例分割(相当于同时检测和分割)object detection 目标检测 (它不是分割,而是一个目标对象的框)语义分割多数时候需要进行后处理,将区域分割开感知机可以用简单的电路逻辑(与门、与非门、或门逻辑)实现,用感知机来表示电路逻辑,参数有无数多种选择把θ换成-b

#深度学习#计算机视觉#机器学习
    共 16 条
  • 1
  • 2
  • 请选择