logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

sklearn.utils.validation.check_random_state 详解

如果你写带随机行为的工具函数,强烈建议用它统一处理种子# 标准化处理随机种子# 使用返回的 rng 生成随机数# 调用:传整数 → 可复现作用:统一校验随机数种子,返回标准实例,保证随机性可复现。输入:支持None/ 非负整数 /实例。使用:自定义随机函数、调用 sklearn 模型时都可以用,是实现可复现实验的核心工具。优势:安全、无副作用、兼容 sklearn 全生态。两个导入路径,指向同一个

#sklearn#人工智能#python
线性回归与逻辑回归:同为凸函数,为何一个有解析解、一个没有?

模型目标函数凸性梯度=0 得到有无解析解线性回归平方损失(二次)凸线性方程组有逻辑回归交叉熵 + sigmoid凸非线性方程组无软 SVM/线性 SVM合页损失凸非线性/含约束无凸不凸决定有没有全局最优,求导后是不是线性方程,才决定有没有解析解。如果你需要,我可以把逻辑回归梯度推导、Hessian 半正定证明、以及为什么非线性方程无闭式解,用更数学的形式完整写一遍。全局最优存在性,梯度方程是否为线

文章图片
#逻辑回归#算法#机器学习
Pytorch实现目标检测

使用的数据集是:Kaggle上的Road Sign Detection数据集。该数据集共有877张图片。因为使用了OpenCV所以各种路径中不能有中文。这个是一定要注意的。在测试集上的分类准确率为:90.34%

#pytorch#目标检测
半监督学习的种类及其优缺点

半监督学习是一种介于监督学习和无监督学习之间的机器学习方法,它利用大量的未标记数据和少量的标记数据来进行模型训练。

文章图片
#人工智能
半监督学习方法的种类

1. **自训练(Self-training)**:模型先用少量标记数据进行训练,然后使用这个模型来预测未标记数据的标签。通过这个过程,模型学习到数据的分布,从而提升分类器的性能。6. **伪标签(Pseudo-labeling)**:使用模型对未标记数据进行预测,并将置信度高的预测结果作为“伪标签”,这些伪标签与真实标签一起用于模型训练。8. **拉普拉斯正则化(Laplacian Regula

文章图片
#机器学习#人工智能
Pytorch实现目标检测

使用的数据集是:Kaggle上的Road Sign Detection数据集。该数据集共有877张图片。因为使用了OpenCV所以各种路径中不能有中文。这个是一定要注意的。在测试集上的分类准确率为:90.34%

#pytorch#目标检测
Python:使用from sklearn.model_selection import train_test_split把数据划分为训练数据和测试数据

import pandas as pdfrom sklearn import datasetsimport matplotlib.pyplot as pltimport matplotlib.cmfrom sklearn.model_selection import train_test_splitfrom sklearn.neighbors import KNeighborsClas...

Python:十折交叉验证sklearn KFold 的使用

from sklearn.model_selection import KFoldfrom sklearn.datasets import load_irisfrom sklearn.ensemble import RandomForestClassifierimport numpy as npX,y = load_iris(return_X_y=True)KF = KFold(n_s...

    共 25 条
  • 1
  • 2
  • 3
  • 请选择