logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

从零实现智能体:深入理解三种经典范式

本文分析了智能体开发的三种经典范式:ReAct范式通过"思考-行动-观察"循环实现边想边做,适合需要实时信息的任务;Plan-and-Solve范式先制定完整计划再执行,适用于步骤明确的多步任务;Reflection范式通过自我反思修正结果,能提高回答质量。作者结合中医RAG系统开发实践,指出实际应用中往往需要融合多种范式优势。这三种范式各有适用场景,开发者可根据任务特点灵活组

文章图片
#python#人工智能
提示工程与大语言模型交互:我的学习记录(二)

本文系统介绍了大语言模型应用中的关键技术要点,主要包含四部分内容:1.提示工程(Prompt Engineering)部分详解了温度参数、Top-k/p采样、Few-shot示例等核心概念,强调优质提示语对模型输出的关键影响;2.文本分词环节对比了词/字符/子词三种分词方式,重点解析BPE算法的运作原理;3.模型选择维度提出性能、成本、部署等关键考量因素;4.最后探讨了缩放法则、能力涌现和幻觉问题

文章图片
#语言模型#交互#学习 +1
从 N-gram 到 GPT:大语言模型是如何演进的?

本文记录了作者与AI导师一天的学习对话,系统梳理了语言模型的发展历程。从基础的N-gram模型及其缺陷讲起,到神经网络语言模型中的词嵌入和RNN/LSTM,最终深入解析Transformer架构的核心机制。重点阐述了自注意力原理、QKV向量、多头注意力等概念,并对比了Encoder-Decoder与Decoder-Only架构的区别。文章以对话形式呈现,循序渐进地展示了语言模型从统计方法到深度学习

文章图片
#语言模型#人工智能#自然语言处理 +1
到底了