logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

动手学深度学习 - 现代递归神经网络 - 10.6 编码器-解码器架构(Encoder-Decoder Architecture)

摘要:编码器-解码器架构是处理序列到序列任务的核心框架,通过编码器将变长输入压缩为状态向量,再由解码器自回归生成目标序列。该架构具有高度通用性,广泛应用于机器翻译、语音识别、文本摘要等场景。其核心优势包括信息压缩能力、生成灵活性及模块化设计。随着注意力机制的引入,有效解决了长序列信息丢失问题。在工业实践中,该架构已拓展至多模态应用,如视频字幕生成、跨语言迁移学习和图文生成系统,通过灵活组合不同编码

文章图片
#深度学习#神经网络#人工智能
程序猿之计算机操作系统 — 1.3 计算机系统的体系结构

本文介绍了计算机系统的四种主要体系结构:单处理器系统(单一CPU执行所有任务)、多处理器系统(提升吞吐量和可靠性,分为对称SMP和非对称AMP)、集群系统(多节点协同工作,提供高可用性)以及Beowulf集群(低成本高性能计算架构)。重点阐述了每种结构的特征、优势及实际应用场景,如嵌入式设备、云服务器、AI训练等。文章从理论和实践两个维度,分析了不同架构在操作系统设计、资源调度和并行计算方面的关键

文章图片
#操作系统
动手学深度学习 - 优化算法 - 12.5 小批量随机梯度下降(Mini-batch SGD)

小批量随机梯度下降(Mini-batch SGD)是深度学习中平衡计算效率与训练稳定性的核心优化方法。本文系统介绍了Mini-batch SGD的理论基础、工程实现与优化技巧,包括:1)算法原理,对比全批量GD和SGD的优缺点;2)硬件加速机制,如矢量化计算和缓存优化;3)批量大小选择策略及对模型性能的影响;4)工业级实现方案,涵盖PyTorch框架应用和大规模训练技巧;5)典型面试问题解析和实战

文章图片
#深度学习#算法#batch
动手学深度学习 - 自然语言处理(NLP) - 15.8. 来自 Transformers 的双向编码器表示 (BERT)

本节深入探讨了BERT(Bidirectional Encoder Representations from Transformers)的核心思想与设计理念,从理论背景、模型架构、PyTorch实现到工程应用等多个角度进行全面解析。BERT通过双向编码器、掩码语言建模(MLM)和下一句预测(NSP)三大技术突破,实现了上下文相关的词表示,显著提升了多义词和语境依赖的处理能力。与传统词向量模型(如W

文章图片
#深度学习#自然语言处理#bert
动手学深度学习 - 8.8. 设计卷积网络架构(AnyNet、RegNet 全解析)

虽然 CNN 长期统治视觉领域,但随着大型数据集(如 LAION-400m)和强大算力的出现,类模型逐渐开始在大型图像任务中超越 CNN。然而,CNN 的归纳偏置(locality、translation invariance)依然非常重要,尤其在资源受限或小数据量场景中。因此,未来视觉模型很可能融合 CNN 与 Transformer 的优势,共同推动技术演进。

文章图片
#深度学习#网络#人工智能
动手学深度学习 - 优化算法 - 12.3 梯度下降

本文系统介绍了深度学习中的基础优化算法——梯度下降。首先从一维梯度下降入手,通过泰勒展开证明负梯度方向可使目标函数单调下降,并讨论了学习率选择的重要性,指出过大或过小的学习率分别会导致发散或收敛缓慢。接着扩展到多维情况,引入梯度向量概念。此外,讲解了牛顿法等自适应方法,分析其快速收敛特性及在非凸问题中的局限性,并探讨了预处理和线搜索等改进策略。最后强调梯度下降是现代优化算法(如Adam)的基础,并

文章图片
#深度学习#算法#人工智能
动手学深度学习 - 现代卷积神经网络 - 8.4 多分支网络(GoogLeNet)

Inception Block、GoogLeNet、模块化网络、全局平均池化、多尺度卷积。

文章图片
#深度学习#cnn#网络
深度学习-数据标注-[特殊字符] 如何在 Roboflow 上进行数据标注:一步步打造自己的目标检测数据集

通过 Roboflow 标注数据,不仅效率高,还可以与 YOLOv8 训练无缝衔接。适合你的行人检测、人车同框等项目场景。下一步就是训练模型,验证标注效果啦!如果你也在做视觉检测项目,欢迎一起交流 🚀数据标注是目标检测中最关键的第一步;Roboflow 是一个非常友好的平台,适合入门和项目实践;手动标注虽然慢,但有利于深入理解“目标”与“语义”的边界;自动标注并非万能,手动标注不可或缺;标注过程

文章图片
#深度学习#目标检测#目标跟踪
动手学深度学习 - 卷积神经网络 - 7.3. Padding 和 Stride

📘 本文对应李沐《动手学深度学习》7.3 节内容,讲解 CNN 中控制特征图尺寸变化的两个关键技术:Padding(填充)与 Stride(步幅)。

文章图片
#深度学习#cnn#人工智能
动手学深度学习 - 5.2 多层感知器的实现

小节内容总结5.2.1 从头实现MLP初始化权重偏置,自己写ReLU与前向传播5.2.2 简洁实现MLP使用Sequential快速搭建网络5.2.3 小结从单层到多层,训练过程保持一致,模型设计为关键焦点。

文章图片
#深度学习#人工智能
    共 118 条
  • 1
  • 2
  • 3
  • 12
  • 请选择