logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

使用谷歌 colab 平台来训练机器学习模型、深度学习模型

前言免费的机器学习资源平台,自己电脑跑不动的模型,可以尝试在谷歌colab平台跑实验,不过感觉还是比不上阿里天池的机器资源,人家可是16G的内存呀!不过感觉人家这个更加方便。谷歌云盘谷歌这个colab是基于云盘的,你的所有代码都在云盘里,如果你要编辑代码,则使用谷歌的...

随机森林实战教程-Python-Demo

前言随机森林Python版本有很可以调用的库,使用随机森林非常方便,主要用到以下的库:sklearnpandasnumpy随机森林入门我们先通过一段代码来了解Python中如何使用随机森林。from sklearn.datasets import load_irisfrom sklearn.ensemble import RandomForestClassif...

#随机森林
感知机损失函数的定义

损失函数感知机的损失函数如下:−1∣∣w∣∣∗∑i=1myi(w⋅xi+b)-{\frac{1}{||w||}}*\sum_{i=1}^{m}y_i({w}\cdot{x_i}+b)−∣∣w∣∣1​∗i=1∑m​yi​(w⋅xi​+b)这是针对于误分类的数据集来说的,也就是说针对分类错误的样本数据所采用损失函数,正确分类的数据不参与,两类误分类的数据:1、正类数据分类到-1结果中,yi...

python jieba 结巴分词报错 AttributeError: 'module' object has no attribute 'cut'

首先这个AttributeError: ‘module’ object has no attribute ‘cut’ 报错的原因是因为有jieba.py这个文件存在,或者jieba这样命名的文件存在,很多新人使用结巴 来分词的时候命名直接为jieba.py,但是其实官方给的教程代码里有import jieba,这样就会引用到你自己这个教程文件jieba.py,而没有引用官方的库,所以报错。

#python
过拟合、欠拟合 -你需要了解的概念

过拟合一张图来说明过拟合:!图片过拟合会造成模型变得复杂,并尽可能拟合训练集,造成在训练集上的准确率特别高,这里就会有一个问题就是:训练集是不靠谱的,其中有容错的数据。直接点,训练集中特别是十几万的数据,会有脏数据,这些脏数据也成为负样本,会造成模型训练有误差,模型在训练的时候并不清楚那些是脏数据,它只会不停的去拟合这些数据,所以过拟合的模型在训练集上准确率特别高,但在测试集上效果不是...

由于/usr/bin 不在PATH 环境变量中,故无法找到该命令

问题描述突然有一天,发现Linux系统中的 ls top等基本命令用不了,提示问题是:由于/usr/bin 不在PATH 环境变量中,故无法找到该命令解决方法环境变量有问题,错误或者不恰当地修改了环境变量,将导致Linux自带的脚本命令不可用。cd /etcvi profile在末尾加上export PATH="$PATH:/usr/local/sbin:/usr/local/bin:/usr/s

#linux
java 捕获异常打印详细错误信息:Exception e

前言dubbo接口数据进行转换的过程中,出现了空指针,但是自己捕获的时候没有注意这个问题,只是简单的打印出来,结果发现答应出来的都是null,基本上是无效的异常打印。完善异常信息一开始的代码是如下所示:try {main(event, controlDTO);} catch (Exception e) {logger.e...

聚类算法总结 - 优缺点对比

前言聚类算法是一种无监督的算法,由于不需要训练集,算法简单快速,引用在一些工程里比较简单突出,今天来了解一下聚类算法。k-means算法(k均值算法)算法步骤:(1)随机选取 K 个点,作为 K 类的聚类中心,用 KiK_iKi​表示(2)遍历所有的数据点 PjP_jPj​,通过计算距离,找到距离 PjP_jPj​ 最近的聚类中心点 KiK_iKi​,此时可以说第 j 个数据属于...

#聚类
latex公式:列向量、矩阵、方程组

直降promtionPrice=skuPrice×(1−max(最大优惠额度)rule1000)promtionPrice=skuPrice×(1−max(最大优惠额度)rule1000)promtionPrice= skuPrice\times({1 -{ \frac{max(\text{最大优惠额度})}{rule_{1000}}}})...

TF-IDF方法提取文本特征--TfidfVectorizer 工具

前言从基本的内容讲起,我们可以利用TF-IDF来提取文本特征,在python中有TfidfVectorizer这中工具可以方便我们使用,对所有样本分词,并且通过设置N-gram来获得特征,然后以这些词作为维度特征对每个样本向量化,最后到模型中训练,本文主要讲解TfidfVectorizer的使用,如何来使用这个工具。...

    共 12 条
  • 1
  • 2
  • 请选择