拾-光个人主页

@qq_73472828

拾-光

2023-01-11 13:41:10 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

【动手学深度学习·第五篇】循环神经网络：LSTM、GRU、语言模型，处理变长序列的正确姿势

本文介绍了循环神经网络(RNN)及其变体LSTM和GRU的核心原理与应用。首先分析了MLP/CNN处理序列数据的局限性，指出RNN通过引入隐状态作为"记忆"来解决这些问题。详细推导了RNN的数学定义和BPTT算法，解释了梯度消失问题的根源。重点拆解了LSTM的四个门控机制和GRU的简化结构，展示了它们如何有效捕获长距离依赖。文章还介绍了处理变长序列的pack_padded_sequence技巧，并

#深度学习 #rnn #lstm +4

【Python × 深度学习 × Agent 系列·第五篇】类型系统与工程化：Pydantic V2、dataclass、LLM 结构化输出，让 Agent 的输出直接被代码使用

本文介绍了Python类型系统与工程化实践，重点讲解了Pydantic V2、dataclass和LLM结构化输出在Agent开发中的应用。主要内容包括： Python类型系统基础：类型注解的元数据特性及其在IDE补全、静态分析和运行时验证中的作用 dataclass的使用：自动生成初始化方法、repr等，适合深度学习配置管理 Pydantic V2的核心功能：模型验证、序列化和JSON Sche

#python #深度学习 #开发语言 +4

【动手学深度学习·第三篇】多层感知机：激活函数、反向传播完整推导、Dropout 与 BatchNorm 的工程细节

本文深入探讨了多层感知机(MLP)的核心原理与实践技巧。首先解释了为什么线性叠加无法增强模型表达能力，必须引入非线性激活函数。随后详细分析了Sigmoid、ReLU、GELU等激活函数的特性与适用场景。文章重点推导了MLP的前向传播与反向传播过程，并针对Dropout和BatchNorm在训练/推理阶段的差异进行了详细说明。通过Fashion-MNIST实验，展示了如何将准确率从84%提升至92%

#深度学习 #人工智能 #推荐算法 +4

【强化学习系列·第 03 篇】策略梯度方法：从 REINFORCE 到 PPO——“直接优化策略“的演进之路

本文系统梳理了强化学习中策略梯度方法的演进历程，从REINFORCE到PPO。策略梯度方法直接优化策略本身，克服了值函数方法在连续动作空间的局限。文章首先阐述了策略梯度定理的核心思想，分析了REINFORCE算法的优缺点；然后详细介绍了四代算法的改进：Actor-Critic降低方差，TRPO引入KL约束保证安全更新，PPO通过Clip操作简化实现。PPO凭借Clip目标函数、GAE优势估计和熵正

#推荐算法 #transformer #算法 +4

【强化学习系列·第 03 篇】策略梯度方法：从 REINFORCE 到 PPO——“直接优化策略“的演进之路

#推荐算法 #transformer #算法 +4

Brew 包管理工具高效开发场景实战

当团队内部需要使用一些未公开的内部工具，或者对开源软件进行了特定的定制修改时，官方的 Homebrew 源显然无法满足需求。此时，搭建私有的 Tap 仓库是最佳解决方案。创建一个私有 Tap 非常简单，本质上就是一个符合 Homebrew 目录结构的 Git 仓库。你需要创建一个名为的仓库，并在其中建立Formula目录，将自定义的 Ruby 公式文件放入其中。公式文件描述了软件的下载地址、校验和

#策略模式

【Python × 深度学习 × Agent 系列·第四篇】Agent 异步编程：async/await 原理、并发 LLM 调用、流式输出与 FastAPI 集成

飞书开源命令行工具lark-cli在45天内GitHub星标破万，成为国内首个万星办公套件开源项目。其核心价值在于为AI Agent提供透明可控的操作接口，通过三层命令架构（快捷命令、API命令、原始API）满足不同场景需求，并显著降低Token消耗。关键创新是--dry-run功能，让AI操作可预览、可审查、可拦截，解决了MCP黑箱模式的操作不可见问题。目前lark-cli已覆盖11大业务域20

#python #深度学习 #fastapi +4

【目标检测系列·第 03 篇】YOLO 系列：从“你只看一次“到实时检测之王——速度与精度的十年博弈

YOLO系列从2016年至今经历了多次革新，从最初的YOLOv1开创单阶段检测范式，到引入Anchor机制和多尺度检测的v2/v3版本，再到工程化巅峰的v4/v5。现代YOLO采用三段式架构（Backbone-Neck-Head）和六大创新技术，包括Anchor-Free设计、解耦头、Mosaic数据增强、DFL损失函数等。最新版本如YOLOv10实现无NMS端到端检测，YOLO26则成为终极形态

#目标检测 #人工智能 #计算机视觉 +3

【爬虫系列·第 01 篇】全景图：从搜索引擎到 AI 数据管道——网络爬虫的前世今生

2025 年，全球爬虫流量同比增长 18%，其中 AI 爬虫（GPTBot）增长 305%。爬虫——这个曾经只有搜索引擎工程师才关心的技术，如今已成为 AI 训练数据的核心管道、商业情报的关键工具、数据科学家的日常武器。但爬虫的本质从未改变：自动获取网页数据。改变的只是目标——从"索引网页让信息可搜索"，到"采集数据让商业可决策"，到"对抗反爬让数据可获取"，再到"训练 AI 让数据可学习"。本系

#爬虫 #搜索引擎 #人工智能 +4

【RAG 系列·第 01 篇】全景图：从信息检索到知识增强——RAG 的前世今生

RAG（检索增强生成）技术通过结合LLM的参数化记忆与外部知识库，有效解决了大语言模型的三大缺陷：幻觉、知识过时和领域盲区。文章梳理了RAG的四代演进：从关键词检索（TF-IDF/BM25）、语义检索（Embedding）、Naive RAG（检索+生成）到Advanced RAG（主动优化检索生成全流程）。相比微调和长上下文方案，RAG具有知识实时更新、可溯源、成本适中等优势，已成为企业级LLM

#人工智能 #语言模型 #自然语言处理 +4

共 329 条

请选择