
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
作用:导入 PyTorch 核心库,所有深度学习操作的基础。类比:就像写作文要先拿笔,torch就是深度学习的 “笔”。作用:导入 PyTorch 的神经网络模块(Neural Network)。核心功能:提供搭建 CNN、全连接层、卷积层等所有网络层的工具。关键:我们搭建的所有 AI 模型,都依赖这个模块。作用:数据加载器,批量管理数据集。通俗理解:把大量图片打包成 “小包裹”,一次性喂给电脑,

在机器学习中,分类问题是最常见的任务之一。比如根据病人的各项指标判断病情等级、根据用户行为预测会员等级等。本文使用一个已经预处理好的多分类数据集(标签为 0、1、2、3),分别用 7 种经典的分类算法进行建模,并对比它们在测试集上的表现。本文以众数填充为例子。每个文件的第一列是标签(y),后面的列是特征(x)

上篇我们介绍了删除法、均值填充和中位数填充,适合快速处理简单缺失问题。本篇将带来三种更“智能”的填充方式:众数填充(分组模式)、线性回归预测填充和随机森林预测填充。它们能更好地利用数据内在关系,尤其适合缺失值较多或特征关联性强的场景。本文围绕矿物分类数据缺失值填充,详细讲解了分组众数填充、线性回归填充、随机森林填充三种智能预处理方法。众数填充按矿物类型分组取高频值填充,简单高效、无模型开销,适合快

在真实的数据挖掘项目中,原始数据往往并不完美——缺失值是最常见的问题之一。如果直接使用含有缺失值的数据训练模型,可能会导致:模型无法计算(很多算法不支持缺失值)统计偏差(缺失并非随机)信息浪费(直接删除行会丢失有用信息)因此,在建模之前,我们需要对缺失值进行合理的填充或删除。即数据预处理。小样本数据:优先考虑中位数或均值填充,避免删除后样本不足。数据量充足且缺失少:直接删除法最简单可靠。下一篇文章

信用卡欺诈检测是典型的类别极不平衡问题:正常交易(负样本)远多于欺诈交易(正样本)。如果直接用原始数据训练,模型会偏向多数类,导致召回率(Recall)很低。本文采用 SMOTE 过采样 技术生成少数类(欺诈)的新样本,使正负样本数量平衡,再使用逻辑回归建模,并通过交叉验证选择最佳正则化参数,最终评估模型性能。如果对该项目有兴趣但是没有了解的读者,可以先观看博主关于逻辑回归下采样的文章。【机器学习

信用卡欺诈是典型的类别极不平衡的分类问题:正常交易(负样本)远多于欺诈交易(正样本)。如果直接用原始数据训练模型,模型会倾向于把所有样本都预测为“正常”,导致召回率极低。本文使用下采样(Undersampling)平衡正负样本,并用逻辑回归建模,最后通过调整分类阈值提升欺诈交易的召回率。本文通过一个完整的代码实例,展示了信用卡欺诈检测的完整流程:数据标准化与清洗—>下采样处理类别不平衡—>交叉验证

在计算机视觉领域,OpenCV 是最经典、最常用的开源图像处理库,无论是基础的图像变换、噪声处理,还是进阶的目标检测、图像分割,都离不开 OpenCV 的核心操作。本次案例全覆盖图像阈值处理、图片打码 / 组合 / 缩放、椒盐噪声生成与平滑滤波、图像像素运算四大核心模块,搭配逐行代码解析 + 原理详解 + 效果说明,流程清晰、零基础可学,非常适合作为 OpenCV 图像处理的入门实战教程。如果对计

线性回归是机器学习中最基础、最经典的监督学习算法,也是新手入门机器学习的首选算法。它的核心思想是通过拟合一条直线 / 超平面,来描述自变量和因变量之间的线性关系,既可以用于预测连续数值,也能分析变量间的关联规律。scikit-learn(简称 sklearn)是 Python 中最常用的机器学习库,封装了完善的线性回归算法接口,无需手动实现复杂数学计算,只需几行代码就能完成模型训练、预测和评估。专

本篇文章从零起步,不讲晦涩公式推导,用大白话讲懂混淆矩阵所有知识点,零基础也能一次性吃透,学完直接用于项目实战、论文实验、模型调优。混淆矩阵是分类任务中最核心的模型评估表格,专门用来直观统计模型预测结果对错分布,主要应用在二分类、多分类场景,日常使用最多的是二分类混淆矩阵。简单理解:把真实标签和模型预测标签两两对应摆放,统计每一种组合的样本数量,形成的二维表格就是混淆矩阵。它的最大作用就是不再只看

OpenCV 是目前最主流的计算机视觉开源库,零基础也能快速上手。本文整理日常开发最常用的OpenCV 基础操作,包含图片读写、灰度图、图像属性、ROI 区域截取、颜色通道拆分合并、视频帧处理,代码可直接复制运行,适合新手入门学习。本文涵盖 OpenCV 最核心八大基础用法:图片读取展示、灰度转换、图像属性查看、区域裁剪、纯色修改、视频播放、摄像头调用。熟练掌握以上代码,就能完成绝大多数基础图像处








