wyxrum 个人主页

@wyxrum

wyxrum

2024-05-15 00:46:17 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

从零实现智能体：深入理解三种经典范式

本文分析了智能体开发的三种经典范式：ReAct范式通过"思考-行动-观察"循环实现边想边做，适合需要实时信息的任务；Plan-and-Solve范式先制定完整计划再执行，适用于步骤明确的多步任务；Reflection范式通过自我反思修正结果，能提高回答质量。作者结合中医RAG系统开发实践，指出实际应用中往往需要融合多种范式优势。这三种范式各有适用场景，开发者可根据任务特点灵活组

#python #人工智能

提示工程与大语言模型交互：我的学习记录（二）

本文系统介绍了大语言模型应用中的关键技术要点，主要包含四部分内容：1.提示工程（Prompt Engineering）部分详解了温度参数、Top-k/p采样、Few-shot示例等核心概念，强调优质提示语对模型输出的关键影响；2.文本分词环节对比了词/字符/子词三种分词方式，重点解析BPE算法的运作原理；3.模型选择维度提出性能、成本、部署等关键考量因素；4.最后探讨了缩放法则、能力涌现和幻觉问题

#语言模型 #交互 #学习 +1

从 N-gram 到 GPT：大语言模型是如何演进的？

本文记录了作者与AI导师一天的学习对话，系统梳理了语言模型的发展历程。从基础的N-gram模型及其缺陷讲起，到神经网络语言模型中的词嵌入和RNN/LSTM，最终深入解析Transformer架构的核心机制。重点阐述了自注意力原理、QKV向量、多头注意力等概念，并对比了Encoder-Decoder与Decoder-Only架构的区别。文章以对话形式呈现，循序渐进地展示了语言模型从统计方法到深度学习

#语言模型 #人工智能 #自然语言处理 +1

到底了