logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【动手学深度学习·第五篇】循环神经网络:LSTM、GRU、语言模型,处理变长序列的正确姿势

本文介绍了循环神经网络(RNN)及其变体LSTM和GRU的核心原理与应用。首先分析了MLP/CNN处理序列数据的局限性,指出RNN通过引入隐状态作为"记忆"来解决这些问题。详细推导了RNN的数学定义和BPTT算法,解释了梯度消失问题的根源。重点拆解了LSTM的四个门控机制和GRU的简化结构,展示了它们如何有效捕获长距离依赖。文章还介绍了处理变长序列的pack_padded_sequence技巧,并

文章图片
#深度学习#rnn#lstm +4
【Python × 深度学习 × Agent 系列·第五篇】类型系统与工程化:Pydantic V2、dataclass、LLM 结构化输出,让 Agent 的输出直接被代码使用

本文介绍了Python类型系统与工程化实践,重点讲解了Pydantic V2、dataclass和LLM结构化输出在Agent开发中的应用。主要内容包括: Python类型系统基础:类型注解的元数据特性及其在IDE补全、静态分析和运行时验证中的作用 dataclass的使用:自动生成初始化方法、repr等,适合深度学习配置管理 Pydantic V2的核心功能:模型验证、序列化和JSON Sche

文章图片
#python#深度学习#开发语言 +4
【动手学深度学习·第三篇】多层感知机:激活函数、反向传播完整推导、Dropout 与 BatchNorm 的工程细节

本文深入探讨了多层感知机(MLP)的核心原理与实践技巧。首先解释了为什么线性叠加无法增强模型表达能力,必须引入非线性激活函数。随后详细分析了Sigmoid、ReLU、GELU等激活函数的特性与适用场景。文章重点推导了MLP的前向传播与反向传播过程,并针对Dropout和BatchNorm在训练/推理阶段的差异进行了详细说明。通过Fashion-MNIST实验,展示了如何将准确率从84%提升至92%

文章图片
#深度学习#人工智能#推荐算法 +4
【强化学习系列·第 03 篇】策略梯度方法:从 REINFORCE 到 PPO——“直接优化策略“的演进之路

本文系统梳理了强化学习中策略梯度方法的演进历程,从REINFORCE到PPO。策略梯度方法直接优化策略本身,克服了值函数方法在连续动作空间的局限。文章首先阐述了策略梯度定理的核心思想,分析了REINFORCE算法的优缺点;然后详细介绍了四代算法的改进:Actor-Critic降低方差,TRPO引入KL约束保证安全更新,PPO通过Clip操作简化实现。PPO凭借Clip目标函数、GAE优势估计和熵正

文章图片
#推荐算法#transformer#算法 +4
【强化学习系列·第 03 篇】策略梯度方法:从 REINFORCE 到 PPO——“直接优化策略“的演进之路

本文系统梳理了强化学习中策略梯度方法的演进历程,从REINFORCE到PPO。策略梯度方法直接优化策略本身,克服了值函数方法在连续动作空间的局限。文章首先阐述了策略梯度定理的核心思想,分析了REINFORCE算法的优缺点;然后详细介绍了四代算法的改进:Actor-Critic降低方差,TRPO引入KL约束保证安全更新,PPO通过Clip操作简化实现。PPO凭借Clip目标函数、GAE优势估计和熵正

文章图片
#推荐算法#transformer#算法 +4
Brew 包管理工具高效开发场景实战

当团队内部需要使用一些未公开的内部工具,或者对开源软件进行了特定的定制修改时,官方的 Homebrew 源显然无法满足需求。此时,搭建私有的 Tap 仓库是最佳解决方案。创建一个私有 Tap 非常简单,本质上就是一个符合 Homebrew 目录结构的 Git 仓库。你需要创建一个名为的仓库,并在其中建立Formula目录,将自定义的 Ruby 公式文件放入其中。公式文件描述了软件的下载地址、校验和

#策略模式
【Python × 深度学习 × Agent 系列·第四篇】Agent 异步编程:async/await 原理、并发 LLM 调用、流式输出与 FastAPI 集成

飞书开源命令行工具lark-cli在45天内GitHub星标破万,成为国内首个万星办公套件开源项目。其核心价值在于为AI Agent提供透明可控的操作接口,通过三层命令架构(快捷命令、API命令、原始API)满足不同场景需求,并显著降低Token消耗。关键创新是--dry-run功能,让AI操作可预览、可审查、可拦截,解决了MCP黑箱模式的操作不可见问题。目前lark-cli已覆盖11大业务域20

文章图片
#python#深度学习#fastapi +4
【目标检测系列·第 03 篇】YOLO 系列:从“你只看一次“到实时检测之王——速度与精度的十年博弈

YOLO系列从2016年至今经历了多次革新,从最初的YOLOv1开创单阶段检测范式,到引入Anchor机制和多尺度检测的v2/v3版本,再到工程化巅峰的v4/v5。现代YOLO采用三段式架构(Backbone-Neck-Head)和六大创新技术,包括Anchor-Free设计、解耦头、Mosaic数据增强、DFL损失函数等。最新版本如YOLOv10实现无NMS端到端检测,YOLO26则成为终极形态

文章图片
#目标检测#人工智能#计算机视觉 +3
【爬虫系列·第 01 篇】全景图:从搜索引擎到 AI 数据管道——网络爬虫的前世今生

2025 年,全球爬虫流量同比增长 18%,其中 AI 爬虫(GPTBot)增长 305%。爬虫——这个曾经只有搜索引擎工程师才关心的技术,如今已成为 AI 训练数据的核心管道、商业情报的关键工具、数据科学家的日常武器。但爬虫的本质从未改变:自动获取网页数据。改变的只是目标——从"索引网页让信息可搜索",到"采集数据让商业可决策",到"对抗反爬让数据可获取",再到"训练 AI 让数据可学习"。本系

文章图片
#爬虫#搜索引擎#人工智能 +4
【RAG 系列·第 01 篇】全景图:从信息检索到知识增强——RAG 的前世今生

RAG(检索增强生成)技术通过结合LLM的参数化记忆与外部知识库,有效解决了大语言模型的三大缺陷:幻觉、知识过时和领域盲区。文章梳理了RAG的四代演进:从关键词检索(TF-IDF/BM25)、语义检索(Embedding)、Naive RAG(检索+生成)到Advanced RAG(主动优化检索生成全流程)。相比微调和长上下文方案,RAG具有知识实时更新、可溯源、成本适中等优势,已成为企业级LLM

文章图片
#人工智能#语言模型#自然语言处理 +4
    共 329 条
  • 1
  • 2
  • 3
  • 33
  • 请选择