logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

深度学习篇---图像数据采集

在使用 Python 通过摄像头采集图像时,我们通常使用OpenCV库来操作。下面详细介绍如何获取和设置摄像头的相关参数,包括分辨率、帧率、曝光时间等关键信息。

文章图片
#opencv#人工智能#计算机视觉
深度学习篇---DenseNet网络结构

本文详细介绍了如何在PyTorch中实现DenseNet-121网络。DenseNet的核心是"密集连接"机制,通过通道拼接使每一层都能直接访问前面所有层的特征。实现步骤包括:1)构建瓶颈层(Bottleneck),使用1×1和3×3卷积控制计算量;2)创建Dense块,通过密集连接串联多个瓶颈层;3)设计过渡层(Transition)进行下采样和通道压缩;4)组合成完整网络,

文章图片
#深度学习#人工智能
深度学习篇---YOLOv常见参数

本文介绍了YOLOv系列模型训练中的关键参数及其调整方法。主要参数包括:批次大小(影响训练稳定性)、训练轮数(防止欠/过拟合)、学习率(控制参数更新步长)、输入图像尺寸(平衡精度与速度)、数据增强(提高模型泛化能力)、锚框设置(影响目标定位精度)、置信度阈值(过滤低质量预测)和正则化参数(防止过拟合)。文章建议根据具体问题(如欠拟合、过拟合、速度慢等)有针对性地调整参数,并强调一次只修改1-2个参

文章图片
#人工智能#机器学习#深度学习
深度学习篇--- ResNet-18

ResNet-18是一种18层的轻量级卷积神经网络,通过"残差连接"设计解决了深层网络训练难题。其核心创新在于为网络添加"捷径",使数据能跳过某些层直接传递,有效防止梯度消失和性能退化。该网络采用分阶段处理结构,逐步从像素提取边缘、细节到整体特征,最终实现图像分类。作为性价比高的智能工具,ResNet-18广泛应用于相册分类、场景识别、医疗影像分析等领域,既

文章图片
#深度学习#人工智能
深度学习篇---损失函数

深度学习中的损失函数是模型优化的关键指标,针对不同任务需选择匹配的损失函数。回归任务常用MSE(对误差敏感)、MAE(抗异常值)和Huber损失(平衡两者);分类任务中,二分类使用交叉熵(BCE),多分类用CCE,类别不均衡时采用FocalLoss;特殊任务如相似度计算使用三元组损失,生成任务则用KL散度衡量分布差异。正确选择损失函数是模型优化的"指南针",直接影响训练效果和应

文章图片
#深度学习#人工智能
深度学习篇---ResNet家族

ResNet家族是深度学习领域的重要网络架构,通过"残差连接"解决深层网络的梯度消失和性能退化问题。核心成员从轻量级的ResNet-18(18层)到强大的ResNet-152(152层),采用BasicBlock或bottleneck结构,平衡精度与计算效率。其中ResNet-50凭借bottleneck设计成为最常用模型。该家族衍生出ResNeXt、SE-ResNet等变体,

文章图片
#深度学习#人工智能
深度学习篇---ResNet-50网络结构

本文介绍了PyTorch实现ResNet-50的关键要点。ResNet-50的核心是使用Bottleneck残差块替代BasicBlock,通过1×1降维、3×3特征提取和1×1升维的三层卷积结构,在保证深度(50层)的同时减少计算量。文章详细拆解了Bottleneck块的实现代码,并类比为"高效快递打包流水线"。随后展示了如何用该模块构建完整的ResNet-50网络,包含初始

文章图片
#深度学习#人工智能
深度学习篇---ResNet-18网络结构

本文介绍了如何使用PyTorch实现ResNet-18模型。主要内容包括:1)将模型构建过程类比为"搭积木":先创建核心的BasicBlock残差块(含2层卷积和残差连接),再用这些块搭建完整模型;2)详细代码实现,包含初始卷积层、4组残差块(共8个BasicBlock)、全局池化和全连接层;3)验证模型流程,通过随机输入数据测试模型输出。文章强调ResNet-18的关键在于残

文章图片
#深度学习#人工智能
深度学习篇---人脸识别

本文系统梳理了8种主流人脸识别方法,通过生活化类比解析其原理与适用场景:基础方法(LBPH、特征脸法、几何特征法等)成本低但精度有限,适合简单场景;进阶方法(Gabor小波、SVM分类)通过优化特征处理提升精度;高端方法(深度学习、3D建模)依赖AI或立体建模实现高安全性,但需更强硬件支持。文章对比了各方法的核心优劣,并给出选型建议:根据预算、场景复杂度、安全需求等维度选择单方法或组合方案。典型应

文章图片
#深度学习#人工智能
上位机知识篇---opencv路径

配置OpenCV开发环境需关注三个关键环节:1) 环境变量Path添加OpenCV的bin目录,确保系统运行时能找到动态链接库(.dll);2) QT的INCLUDEPATH需包含OpenCV头文件的三个层级目录(include/opencv、opencv2等),保证编译器正确识别新旧版本头文件;3) LIBS配置通过通配符链接静态库(.a文件),将OpenCV功能实现嵌入可执行程序。三者分别解决

文章图片
#opencv#webpack#前端
    共 188 条
  • 1
  • 2
  • 3
  • 19
  • 请选择