logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【值得收藏】大模型小白必看:Transformer核心原理解析与应用

本文详细解析了Transformer架构的核心原理,包括自注意力机制、多头注意力机制、位置编码、Encoder和Decoder组成等内容。Transformer作为大模型的基础架构,通过自注意力机制实现并行处理和长距离依赖捕捉,多头注意力机制让模型从多角度理解上下文,位置编码保留了序列信息。Encoder负责输入序列编码,Decoder结合编码信息和已生成内容预测输出,Mask机制确保预测只依赖历

文章图片
#transformer#人工智能
【值得收藏】大模型小白必看:Transformer核心原理解析与应用

本文详细解析了Transformer架构的核心原理,包括自注意力机制、多头注意力机制、位置编码、Encoder和Decoder组成等内容。Transformer作为大模型的基础架构,通过自注意力机制实现并行处理和长距离依赖捕捉,多头注意力机制让模型从多角度理解上下文,位置编码保留了序列信息。Encoder负责输入序列编码,Decoder结合编码信息和已生成内容预测输出,Mask机制确保预测只依赖历

文章图片
#transformer#人工智能
【干货收藏】多Agent系统:让AI从“单兵作战“到“群体协作“的进化之路

多Agent系统是AI从"单兵作战"迈向"群体智慧"的关键架构,通过多个智能体分工协作解决复杂问题。主流框架包括AutoGen、CrewAI和LangGraph,通信依赖MCP和A2A等标准化协议。系统调度策略多样,需考虑并行、依赖和资源平衡,同时需建立重试、熔断等机制保障可靠性。随着标准化成熟,多Agent系统将推动AI真正融入生产体系,形成能协同思考、自动执行的"数字员工团队"。

文章图片
#人工智能
【干货收藏】多Agent系统:让AI从“单兵作战“到“群体协作“的进化之路

多Agent系统是AI从"单兵作战"迈向"群体智慧"的关键架构,通过多个智能体分工协作解决复杂问题。主流框架包括AutoGen、CrewAI和LangGraph,通信依赖MCP和A2A等标准化协议。系统调度策略多样,需考虑并行、依赖和资源平衡,同时需建立重试、熔断等机制保障可靠性。随着标准化成熟,多Agent系统将推动AI真正融入生产体系,形成能协同思考、自动执行的"数字员工团队"。

文章图片
#人工智能
程序员必看!上下文工程:解锁大模型潜力的核心技能(建议收藏)

上下文工程是构建动态系统,以正确格式提供合适信息和工具,使LLM能合理完成任务。随着应用复杂度增加,提供完整结构化上下文比巧妙提示更重要。上下文工程是一个整合多源信息的动态系统,需提供准确信息、合适工具和正确格式。它超越了传统提示工程,成为AI工程师必备的核心技能,包括工具使用、记忆管理、检索等要素,直接影响大模型应用的效能。

文章图片
#人工智能
程序员必看!上下文工程:解锁大模型潜力的核心技能(建议收藏)

上下文工程是构建动态系统,以正确格式提供合适信息和工具,使LLM能合理完成任务。随着应用复杂度增加,提供完整结构化上下文比巧妙提示更重要。上下文工程是一个整合多源信息的动态系统,需提供准确信息、合适工具和正确格式。它超越了传统提示工程,成为AI工程师必备的核心技能,包括工具使用、记忆管理、检索等要素,直接影响大模型应用的效能。

文章图片
#人工智能
收藏必备!从Token到思维链:小白也能看懂的大模型全解析

本文以通俗易懂的方式解析大模型核心原理,从Token处理、RAG技术到稠密与稀疏模型架构,全面介绍大模型的"思考"方式。详解预训练与后训练过程,包括监督微调和强化学习如何塑造模型能力,以及蒸馏量化技术如何让大模型落地应用。帮助读者理解AI本质,消除技术焦虑,成为AI时代的明白人。

文章图片
#人工智能
收藏必备!从Token到思维链:小白也能看懂的大模型全解析

本文以通俗易懂的方式解析大模型核心原理,从Token处理、RAG技术到稠密与稀疏模型架构,全面介绍大模型的"思考"方式。详解预训练与后训练过程,包括监督微调和强化学习如何塑造模型能力,以及蒸馏量化技术如何让大模型落地应用。帮助读者理解AI本质,消除技术焦虑,成为AI时代的明白人。

文章图片
#人工智能
【收藏必备】大模型Agent实战:如何利用文件系统解决上下文工程痛点

本文探讨了RAG在处理复杂任务时的局限性,提出让大模型Agent自主使用文件系统进行上下文管理。文件系统作为卸载机制,让Agent按需加载和持久化数据,既解决了长上下文的Token消耗问题,又保持了数据的完整逻辑结构。相比向量检索,文件系统提供确定性数据访问,更适合代码处理等场景。为Agent提供持久化工作区,可使其分步骤处理复杂任务,大幅提升效率。

文章图片
#人工智能
【收藏必备】大模型Agent实战:如何利用文件系统解决上下文工程痛点

本文探讨了RAG在处理复杂任务时的局限性,提出让大模型Agent自主使用文件系统进行上下文管理。文件系统作为卸载机制,让Agent按需加载和持久化数据,既解决了长上下文的Token消耗问题,又保持了数据的完整逻辑结构。相比向量检索,文件系统提供确定性数据访问,更适合代码处理等场景。为Agent提供持久化工作区,可使其分步骤处理复杂任务,大幅提升效率。

文章图片
#人工智能
    共 1082 条
  • 1
  • 2
  • 3
  • 109
  • 请选择