logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

吴恩达机器学习 - 第八章 逻辑回归的代价函数以及具体实现

逻辑回归的代价函数,不只是优化目标,它是机器理解分类“对错”的逻辑边界。

文章图片
#机器学习#逻辑回归#人工智能
新所得库 - Ollama模型拉取路径如何改装到非C盘

于是,我决定深入研究 Ollama 的**“模型路径改装术”**,记录下这趟趟“被迫科学研究”的全过程。在部署本地大模型的过程中,Ollama 是一个非常简洁高效的工具,支持直接。,但我们可以用 Windows 的软链接机制曲线救国。⚠️ 失败:Ollama 根本不识别这个环境变量。无法修改路径,一拉爆盘、系统卡顿 ⛔。不用修改 Ollama 的内部逻辑。Ollama 以为它还在 C 盘。✅ 模型

文章图片
动手学深度学习 - 卷积神经网络 - 7.3. Padding 和 Stride

📘 本文对应李沐《动手学深度学习》7.3 节内容,讲解 CNN 中控制特征图尺寸变化的两个关键技术:Padding(填充)与 Stride(步幅)。

文章图片
#深度学习#cnn#人工智能
动手学深度学习 - 自然语言处理:预训练 - 15.2 近似训练

《动手学深度学习:自然语言处理中的近似训练方法》摘要 本文介绍了两种高效训练词嵌入模型的近似方法:负采样和分层Softmax。针对传统Softmax在大型词典中计算复杂度高的问题,负采样通过局部二分类替代全局归一化,仅需计算正样本和少量负样本;分层Softmax则构建二叉树结构,将训练复杂度降至对数级别。文章详细阐述了两种方法的理论基础、工程实践中的优化技巧,并结合Google、Facebook等

文章图片
#深度学习#自然语言处理#人工智能
动手学深度学习 - 计算性能 - 13.4 硬件

本文系统剖析了深度学习系统的硬件架构与性能特征。核心硬件包括:CPU(多级缓存、SIMD指令)、GPU(高并行计算、张量核心)、内存(DDR4/GDDR6/HBM2带宽差异)、存储(SSD随机访问优势)以及网络总线(PCIe/NVLink)。重点揭示了各类硬件的延迟特性(从1ns到150ms跨越9个数量级)和带宽瓶颈,强调通过批处理、矢量化、缓存优化等技术匹配算法与硬件特性。文中配有架构图说明Sk

文章图片
#深度学习#人工智能
动手学深度学习 - 推荐系统 - 21.1 推荐系统概述

推荐系统是现代互联网平台的核心技术,通过分析用户行为和偏好实现个性化内容推送。本文概述了推荐系统的基本原理和关键方法:协同过滤通过相似用户或商品进行推荐;显式反馈(评分)和隐式反馈(点击)为系统提供数据支撑;推荐任务包括评分预测、Top-K推荐等。针对企业实践,文章介绍了分层推荐架构(召回-粗排-精排-重排)及冷启动解决方案。还包含面试题和场景案例分析,如抖音短视频的冷启动问题。推荐系统正朝着更智

文章图片
#人工智能#深度学习#神经网络
动手学深度学习 - 11.3 注意力评分函数

注意力机制的核心在于:如何根据 Query 与 Key 的关系,计算出合理的注意力权重。本节我们将系统讲解两种主流的评分函数:点积注意力(Dot Product Attention)与加法注意力(Additive Attention),它们构成 Transformer 架构的关键基础。

文章图片
#深度学习#人工智能
深度学习 - 5.3. 前向传播、后向传播与计算图

到目前为止,我们已经使用小批量随机梯度下降训练了模型。然而,在实现时,我们只需要关心如何通过前向传播和后向传播计算损失和梯度。深度学习中,梯度的自动计算极大简化了算法实现。在早期,即使模型有微小更改,也需手动推导复杂的导数。而现代自动微分(autograd)机制,让我们能够专注于模型设计本身。不过,要真正深入理解深度学习,掌握前向传播、后向传播和计算图的细节是不可或缺的。

文章图片
#深度学习#人工智能
新所得库 - Ultralytics YOLOv8 原始结构全面解析

YOLOv8不仅是YOLO系列的一次进化,也是Ultralytics团队在深度学习应用工程化方向的重要探索。它在轻量化高精度模块灵活性等方面做到了极致,适用于边缘部署、实时检测、自动驾驶、安防监控等多种场景。未来,随着YOLOv9、YOLOv11等新版本的不断迭代,YOLO系列在特征融合、注意力机制、多任务学习方面,还将迎来更多创新!

文章图片
    共 143 条
  • 1
  • 2
  • 3
  • 15
  • 请选择