logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【深度学习系列--经典论文解读】Gradient-Based Learning Applied to Document Recognition

该论文首次将卷积神经网络(CNN)成功应用于文档识别任务,提出了经典的LeNet-5架构,通过局部连接、权重共享等创新设计,实现了端到端的手写字符识别。论文还提出图变换网络(GTN)用于统一优化文档识别的各个模块,在MNIST数据集上取得当时最优性能,并实际应用于银行支票识别系统。虽然存在训练数据依赖性强、实现复杂度高等局限,但该工作奠定了现代深度学习文档识别的基础范式,其"自动特征学习"和"全局

文章图片
#深度学习#论文阅读#计算机视觉
【深度学习系列--经典论文解读】ImageNet Classification with Deep Convolutional Neural Networks

AlexNet是深度学习的里程碑式论文,开创了计算机视觉的新时代。该论文提出的深度卷积神经网络在2012年ImageNet比赛中以15.3%的错误率远超传统方法(26.2%),主要创新包括:使用ReLU激活函数加速训练、Dropout防止过拟合、GPU并行计算解决显存限制、数据增强提升泛化能力。虽然存在计算成本高、LRN效果有限等局限,但其深度架构设计理念(5卷积层+3全连接层)和训练方法为后续V

文章图片
#深度学习#人工智能
【小白深度学习系列】目标检测与分割的基础核心概念

通过上采样(如转置卷积或上采样操作)将高层特征图的分辨率增加,使之与低层特征图的分辨率匹配,后将这些特征图与对应的低层特征图进行融合(通常是通过逐元素相加)。对于逻辑回归或神经网络的输出层使用softmax函数的情况,置信度评分可以直接从softmax函数的输出中获得,即每个类别的预测概率。在多个尺度上提取的特征,这些特征可以来自原始图像的不同分辨率,或者来自卷积神经网络(CNN)中不同层次的特征

文章图片
#深度学习#目标检测#人工智能
【3D视觉入门系列】点云数据全解析:典型处理流程与可视化指南

一文带你深入理解点云的典型处理流程和可视化工具

文章图片
#深度学习
【深度学习系列】MNIST手写数字识别--PyTorch版

摘要:本文介绍了一个基于PyTorch的MNIST手写数字识别项目。使用包含7万张28×28灰度图像的经典数据集,构建了包含卷积层、ReLU激活、池化层和Dropout的CNN模型。通过Adadelta优化器和学习率调度器进行训练,最终测试准确率达到99.26%。文章详细解析了数据处理、网络结构和训练流程,并分析了模型在模糊数字上的识别困难。该项目作为深度学习入门实践,完整代码已开源,适合初学者学

文章图片
#深度学习#pytorch#人工智能
【小白深度学习系列】波士顿房价预测--梯度下降法

采用梯度下降法优化参数w和b,通过最小化均方误差损失函数来拟合线性关系z=wx+b。个人学习记录。

文章图片
#深度学习#人工智能
到底了