logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

图解Transformer:现代AI的通用基石

本文解析了Transformer架构如何自2017年提出后成为AI领域的核心基础。通过对比RNN逐字处理的低效,揭示了Transformer通过自注意力机制实现并行计算和长程依赖的核心突破:1)多头注意力可动态计算词间关联,解决上下文理解难题;2)位置编码保留序列信息;3)模块化设计支持堆叠深层网络。文章阐述了Transformer通用性背后的关键——将各类数据(文本/图像/视频)转化为&quot

#人工智能
图解Transformer:现代AI的通用基石

本文解析了Transformer架构如何自2017年提出后成为AI领域的核心基础。通过对比RNN逐字处理的低效,揭示了Transformer通过自注意力机制实现并行计算和长程依赖的核心突破:1)多头注意力可动态计算词间关联,解决上下文理解难题;2)位置编码保留序列信息;3)模块化设计支持堆叠深层网络。文章阐述了Transformer通用性背后的关键——将各类数据(文本/图像/视频)转化为&quot

#人工智能
03 - Context 与 Context Window:大模型的“临时记忆“

讲了agent的原理之一,上下文的记忆等等

#人工智能
06 - MCP 模型上下文协议:统一 AI 工具的“Type-C 接口“

本文介绍了MCP(模型上下文协议)作为解决AI工具接入标准不统一问题的方案。MCP由Anthropic提出,旨在建立类似Type-C接口的统一标准,使开发者只需编写一次工具即可跨平台使用。协议采用Host-Client-Server三层架构,支持stdio和HTTP两种通信方式。目前MCP生态正在快速发展,已有多个平台和社区工具支持,但仍面临协议迭代、安全隐患和平台兼容性等挑战。MCP通过标准化工

#人工智能#开发语言
05 - Tool 工具调用:让 AI “长出双手“

本文探讨了大语言模型(LLM)如何通过工具调用(Tool)突破其文本输出的局限。核心观点包括:1)LLM本质只能输出文本,无法直接获取实时信息或操作外部系统;2)工具本质是函数,通过描述告知模型可用功能;3)完整调用流程涉及用户、平台、LLM和工具四个角色,模型仅生成调用指令,由平台实际执行;4)工具应用场景广泛,包括实时信息查询、系统操作和环境交互;5)进阶形式支持多工具并行和调用链。工具调用是

#人工智能#算法#开发语言
03 - Context 与 Context Window:大模型的“临时记忆“

讲了agent的原理之一,上下文的记忆等等

#人工智能
04 - Prompt 提示词:与 AI 对话的艺术

本文探讨了大语言模型中的Prompt(提示词)概念,将其分为SystemPrompt和UserPrompt两类:前者由开发者预设,定义模型角色和行为规则;后者是用户输入的具体问题。文章通过数学辅导机器人的例子说明两者的配合机制,并介绍了Prompt工程的基本原则,包括明确角色、结构化约束、示例引导和思维链方法。作者指出Prompt已从简单指令发展为分层体系,强调理解这一结构对优化AI交互的重要性。

#人工智能
02 - Token 与 Tokenizer:模型如何“读懂“文字

本文介绍了大语言模型中Token和Tokenizer的核心概念。Tokenizer作为连接人类语言与机器数字的桥梁,负责将文字编码为数字(Token ID)供模型处理,再将输出解码回文字。Token是文本处理的最小单元,不等于词语,其切分规则由模型自动学习。中英文Token差异显著,中文通常消耗更多Token。Token直接影响模型计费、上下文窗口限制和生成质量。文章通过具体示例展示了中英文词汇的

#人工智能
    共 12 条
  • 1
  • 2
  • 请选择