logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

AI大语言模型学习笔记之三:协同深度学习的黑魔法 - GPU与Transformer模型

同理,可以获得第2个位置的 Attention 向量,或者继续扩展输入序列获得更多的,原理都是一样的。讨论到这里,相信你已经知道什么是注意力机制了,但为了更正式一点,我重新组织一下注意力机制的计算过程。

文章图片
#人工智能#深度学习#语言模型
【必学收藏】Transformer揭秘:AI大模型的注意力机制与架构解析

本文深入浅出介绍了Transformer技术,重点解析了注意力机制如何解决传统模型的长距离依赖问题。通过自注意力和多头注意力的生动比喻,展示了Transformer高效处理语言信息的方式。详细阐述了编码器-解码器架构及其三种变体在不同AI大模型中的应用,揭示了Transformer作为当前人工智能基石技术的重要性,为理解ChatGPT等大模型提供了清晰的技术路线图。

文章图片
#人工智能#transformer
【必学收藏】Transformer揭秘:AI大模型的注意力机制与架构解析

本文深入浅出介绍了Transformer技术,重点解析了注意力机制如何解决传统模型的长距离依赖问题。通过自注意力和多头注意力的生动比喻,展示了Transformer高效处理语言信息的方式。详细阐述了编码器-解码器架构及其三种变体在不同AI大模型中的应用,揭示了Transformer作为当前人工智能基石技术的重要性,为理解ChatGPT等大模型提供了清晰的技术路线图。

文章图片
#人工智能#transformer
【值得收藏】vLLM大模型推理引擎:从单进程到多进程分布式架构详解

文章详细介绍了vLLM推理引擎从单进程(UniprocExecutor)到多进程(MultiProcExecutor)的架构演进,阐述了多进程环境下vLLM如何通过张量并行和流水线并行扩展处理能力,以及分布式系统中的无头服务器与API服务器实现机制。同时分析了延迟与吞吐量的平衡关系,提供了vLLM性能测试与调优指南,帮助读者理解大模型推理引擎的分布式架构设计与优化策略。

文章图片
#分布式#人工智能
【值得收藏】vLLM大模型推理引擎:从单进程到多进程分布式架构详解

文章详细介绍了vLLM推理引擎从单进程(UniprocExecutor)到多进程(MultiProcExecutor)的架构演进,阐述了多进程环境下vLLM如何通过张量并行和流水线并行扩展处理能力,以及分布式系统中的无头服务器与API服务器实现机制。同时分析了延迟与吞吐量的平衡关系,提供了vLLM性能测试与调优指南,帮助读者理解大模型推理引擎的分布式架构设计与优化策略。

文章图片
#分布式#人工智能
收藏必备!揭秘AI智能体核心原理,Python轻松实现从零开始构建一个基于Gemini3的AI Agent

文章介绍了AI智能体的核心原理及构建方法。AI智能体本质上是运行在循环中的大语言模型,配备可调用工具。文章通过四步骤(基础文本生成、工具使用能力、实现闭环、多轮交互)指导读者使用Python和Gemini模型构建智能体,并提供工具设计、上下文工程等最佳实践。掌握基础后,开发者可利用开源框架构建更复杂的智能体系统。

文章图片
#人工智能#python
收藏必备!揭秘AI智能体核心原理,Python轻松实现从零开始构建一个基于Gemini3的AI Agent

文章介绍了AI智能体的核心原理及构建方法。AI智能体本质上是运行在循环中的大语言模型,配备可调用工具。文章通过四步骤(基础文本生成、工具使用能力、实现闭环、多轮交互)指导读者使用Python和Gemini模型构建智能体,并提供工具设计、上下文工程等最佳实践。掌握基础后,开发者可利用开源框架构建更复杂的智能体系统。

文章图片
#人工智能#python
【收藏必备】LangChain 1.0新特性深度解析:create_agent与Middleware实战技巧

LangChain 1.0两大核心更新:create_agent接口简化了带工具调用的ReAct agent创建,通过循环判断tool_call实现智能决策;Middleware引入切面编程思想,提供6个hook点,使Context Engineering更加灵活。内置的HumanInTheLoopMiddleware、ModelCallLimitMiddleware等中间件可处理高危操作确认、请

文章图片
#人工智能
【收藏必备】LangChain 1.0新特性深度解析:create_agent与Middleware实战技巧

LangChain 1.0两大核心更新:create_agent接口简化了带工具调用的ReAct agent创建,通过循环判断tool_call实现智能决策;Middleware引入切面编程思想,提供6个hook点,使Context Engineering更加灵活。内置的HumanInTheLoopMiddleware、ModelCallLimitMiddleware等中间件可处理高危操作确认、请

文章图片
#人工智能
大模型局限性全面解析:为何需要RAG技术?零基础小白收藏这一篇就够了!!

本文详细分析了大型语言模型的四大局限性:知识依赖训练数据、知识更新滞后、易产生幻觉及数据安全问题。针对这些问题,文章介绍了检索增强生成(RAG)技术作为解决方案,阐述了RAG的工作原理(索引、查询理解、信息检索、提示构建和响应生成),探讨了RAG实践中面临的三大挑战,并系统梳理了RAG的九大研究范式分类,为开发者提供了全面的技术路线图。

文章图片
#人工智能#RAG
    共 1178 条
  • 1
  • 2
  • 3
  • 118
  • 请选择