Dick507 个人主页

@weixin_72630804

Dick507

2026-05-19 20:30:11 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

一文讲透 AI Agent：为什么它比 ChatGPT 更像真正的“智能助手”？

AI智能体（AIAgent）是一种能够自主决策和执行任务的AI系统，与ChatGPT等对话式AI不同，它不仅能回答问题，还能理解目标、拆解任务、调用工具并完成复杂流程。AIAgent由大脑（大模型）、记忆（上下文保存）、工具（外部功能调用）和行动（反馈调整）四个核心模块组成，能够主动规划步骤并持续执行任务。其应用场景广泛，包括学习助手、编程辅助、内容创作、办公自动化和机器人控制等。AIAgent的

#人工智能 #AIGC

一文讲透 AI Agent：为什么它比 ChatGPT 更像真正的“智能助手”？

#人工智能 #AIGC

一文讲透 AI Agent：为什么它比 ChatGPT 更像真正的“智能助手”？

#人工智能 #AIGC

一文讲透 AI Agent：为什么它比 ChatGPT 更像真正的“智能助手”？

#人工智能 #AIGC

一文讲透 AI Agent：为什么它比 ChatGPT 更像真正的“智能助手”？

#人工智能 #AIGC

一文讲透 AI Agent：为什么它比 ChatGPT 更像真正的“智能助手”？

#人工智能 #AIGC

一文讲透 AI Agent：为什么它比 ChatGPT 更像真正的“智能助手”？

#人工智能 #AIGC

GPT详解

GPT是一种基于纯解码器架构的自回归语言模型，通过条件概率乘积建模文本序列。其核心特点包括：1)自回归生成，只能基于历史token预测下一个token；2)采用去除了交叉注意力层的Transformer解码器结构；3)使用因果掩码确保仅关注过去信息；4)普遍采用Pre-LayerNorm提升训练稳定性；5)位置编码从早期可学习绝对编码发展为RoPE旋转位置编码，增强长度外推能力。这些设计使GPT系

vLLM--量化技术

摘要：量化技术通过将FP16数据转换为INT8/INT4等低精度格式，可显著减少显存占用并提升吞吐量。vLLM支持权重量化和KV-Cache量化两种方式，主要量化方案包括：FP8量化（H100/H200原生支持，精度接近FP16）、AWQ（最优INT4方案）和GPTQ（经典INT4方案）。用户可单独对KV-Cache进行INT8量化以保持权重精度。配置参数包括--quantization（fp8/

#python #开发语言

可学习位置编码与 RoPE 详解

本文对比了两种Transformer位置编码方法：可学习位置编码和旋转位置编码(RoPE)。可学习位置编码通过可训练矩阵提供绝对位置信息，适用于BERT、GPT-2等固定长度任务，但外推性差。RoPE则通过数学旋转操作将相对位置信息编码到注意力计算中，无需额外参数，具有更好的长度外推性，被LLaMA、ChatGLM等大语言模型采用。两者关键区别在于：可学习编码依赖训练数据，而RoPE基于数学规则；

#学习

共 17 条

请选择