菜园狸花喵个人主页

@weixin_44934373

菜园狸花喵

2022-11-25 15:17:14 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

在github上上传文件

github上传文件

#github #git

特征工程之特征选择

1、过滤法方差过滤过滤法的主要对象：需要遍历特征或者升维的算法们（KNN，单棵决策树。支持向量机SVM、神经网络、回归算法）。因为他们需要遍历特征或者升维的特点，所以这些算法本身的运算量就很大，需要的时间就很长。因此方差过滤这样的特征选择对他们来说就尤为重要。但对于不需要遍历特征的算法，比如随机森林，它选取特征进行分枝，本身运算就非常快速，因此特征选择对它们来说效果平平。过滤法的主要目的：在维持算

#机器学习 #人工智能

python抓取状态码418 | 豆瓣小王子评论抓取 |评分总和

场景：爬取豆瓣评论，状态码为418一、常见的HTTP状态码HTTP状态码的英文为HTTP Status Code。HTTP状态码共分为5种类型：常见的HTTP状态码：200 - 请求成功301 - 资源（网页等）被永久转移到其它URL404 - 请求的资源（网页等）不存在500 - 内部服务器错误（来源：https://www.runoob.com/http/http-status-codes.h

#python

深度学习与计算机视觉

semantic segmentation语义分割（不区分有几头牛，而是这一个区域都是牛）instance segmentation实例分割（相当于同时检测和分割）object detection 目标检测（它不是分割，而是一个目标对象的框）语义分割多数时候需要进行后处理，将区域分割开感知机可以用简单的电路逻辑（与门、与非门、或门逻辑）实现，用感知机来表示电路逻辑，参数有无数多种选择把θ换成-b

#深度学习 #计算机视觉 #机器学习

机器学习四大编程语言对比：R、Python、Matlab、Octave

R 语言R 是一种用于统计计算和图的语言及环境。它是一个 GNU 项目，与贝尔实验室的 John Chambers 及其同事开发的 S 语言及环境类似。R 可以视为 S 的一种不同实现。二者存在一些重要差异，但使用 S 写的很多代码在 R 下运行时无需修改。优点：端到端开发到执行（一些 brokers package 允许执行，IB）开发速度快（比 Python 的代码少 60%）开源包多成熟的量

#机器学习

三蓝一棕 | 深度学习

其他知识的补充：最典型的MLP包括包括三层：输入层、隐藏层和输出层，MLP神经网络不同层之间是全连接的（全连接的意思就是：上一层的任何一个神经元与下一层的所有神经元都有连接）。神经网络主要有三个基本要素：权重、偏置和激活函数。权重告诉神经元需要关注什么样的像素图案。权重有点像连接的强弱。偏置告诉你加权和得有多大才能让神经元的激发变得有意义。而偏置值表示神经元是否更容易被激活。激活函数：起非线性映射

#深度学习

李沐《机器学习》——1.4数据标注

数据标注：当已经有一部分标注，可以使用半监督学习如果你的标志不够多, 但你有钱, 可以花钱去众包, 找人来标注.如果你的标注不够, 但你又没钱，可以自己从数据中提取出来弱一点的标准，进行弱监督学习再不行还可以选择无监督的算法半监督学习：想对有标注的数据和没有标注的数据一起使用的话，针对两者的数据分布之间有一些假设：连续性假设。如果一个样本的特征和另一个样本相似的话，那么很有可能两者是同一标号。聚

迁移学习

迁移学习

共 16 条

请选择