模型优化师个人主页

@2401_85325557

模型优化师

2024-09-03 10:54:58 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

AI大语言模型学习笔记之三：协同深度学习的黑魔法 - GPU与Transformer模型

同理，可以获得第2个位置的 Attention 向量，或者继续扩展输入序列获得更多的，原理都是一样的。讨论到这里，相信你已经知道什么是注意力机制了，但为了更正式一点，我重新组织一下注意力机制的计算过程。

#人工智能 #深度学习 #语言模型

【必学收藏】Transformer揭秘：AI大模型的注意力机制与架构解析

本文深入浅出介绍了Transformer技术，重点解析了注意力机制如何解决传统模型的长距离依赖问题。通过自注意力和多头注意力的生动比喻，展示了Transformer高效处理语言信息的方式。详细阐述了编码器-解码器架构及其三种变体在不同AI大模型中的应用，揭示了Transformer作为当前人工智能基石技术的重要性，为理解ChatGPT等大模型提供了清晰的技术路线图。

#人工智能 #transformer

【必学收藏】Transformer揭秘：AI大模型的注意力机制与架构解析

#人工智能 #transformer

【值得收藏】vLLM大模型推理引擎：从单进程到多进程分布式架构详解

文章详细介绍了vLLM推理引擎从单进程(UniprocExecutor)到多进程(MultiProcExecutor)的架构演进，阐述了多进程环境下vLLM如何通过张量并行和流水线并行扩展处理能力，以及分布式系统中的无头服务器与API服务器实现机制。同时分析了延迟与吞吐量的平衡关系，提供了vLLM性能测试与调优指南，帮助读者理解大模型推理引擎的分布式架构设计与优化策略。

#分布式 #人工智能

【值得收藏】vLLM大模型推理引擎：从单进程到多进程分布式架构详解

#分布式 #人工智能

收藏必备！揭秘AI智能体核心原理，Python轻松实现从零开始构建一个基于Gemini3的AI Agent

文章介绍了AI智能体的核心原理及构建方法。AI智能体本质上是运行在循环中的大语言模型，配备可调用工具。文章通过四步骤（基础文本生成、工具使用能力、实现闭环、多轮交互）指导读者使用Python和Gemini模型构建智能体，并提供工具设计、上下文工程等最佳实践。掌握基础后，开发者可利用开源框架构建更复杂的智能体系统。

#人工智能 #python

收藏必备！揭秘AI智能体核心原理，Python轻松实现从零开始构建一个基于Gemini3的AI Agent

#人工智能 #python

【收藏必备】LangChain 1.0新特性深度解析：create_agent与Middleware实战技巧

LangChain 1.0两大核心更新：create_agent接口简化了带工具调用的ReAct agent创建，通过循环判断tool_call实现智能决策；Middleware引入切面编程思想，提供6个hook点，使Context Engineering更加灵活。内置的HumanInTheLoopMiddleware、ModelCallLimitMiddleware等中间件可处理高危操作确认、请

#人工智能

【收藏必备】LangChain 1.0新特性深度解析：create_agent与Middleware实战技巧

#人工智能

大模型局限性全面解析：为何需要RAG技术？零基础小白收藏这一篇就够了！！

本文详细分析了大型语言模型的四大局限性：知识依赖训练数据、知识更新滞后、易产生幻觉及数据安全问题。针对这些问题，文章介绍了检索增强生成(RAG)技术作为解决方案，阐述了RAG的工作原理(索引、查询理解、信息检索、提示构建和响应生成)，探讨了RAG实践中面临的三大挑战，并系统梳理了RAG的九大研究范式分类，为开发者提供了全面的技术路线图。

#人工智能 #RAG

共 1178 条

请选择