rockkiller71 个人主页

@rockkiller

rockkiller71

2024-05-22 14:27:33 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

ReAct的论文思想剖析及demo实现

本文提出ReAct框架，通过思考-行动-观察的循环机制，将大语言模型的推理能力与外部工具调用能力有机结合。文章详细阐述了ReAct的形式化定义、提示工程实现及与基线方法的对比，同时指出其面临上下文窗口爆炸、工具调用脆弱性等局限性。最后介绍了ReAct与其他范式（如Reflexion、Toolformer）的联系，并提供了优化后的Python实现方案，包括改进的解析器和智能工具执行器。该框架为构建兼

#python #自然语言处理 #人工智能 +1

LangChain源码分析之JSONLoader

本文分析了LangChain中JSONLoader的源码。LangChain的JSONLoader通过集成强大的jq查询语言，实现了对JSON数据的灵活、高效解析。它采用预编译和懒加载策略优化性能，并能智能处理不同的文件格式。其设计精妙之处在于提供了一个关键开关，让内容提取方式在简单键值访问与复杂表达式查询间切换，完美平衡了易用性与灵活性。此外，它还支持通过自定义函数来丰富元数据，并结合早期验证机

#源代码管理 #json #学习 +1

Plan-and-Solve 论文的方法论详解

本文系统分析了大型语言模型从微调范式到提示范式的演进，重点探讨了思维链(CoT)技术的发展。研究指出传统Zero-shot-CoT存在步骤缺失、计算错误等问题，提出了创新的Plan-and-Solve(PS)提示方法。PS通过"理解问题-制定计划-执行计划"的结构化思维，显著提升了模型推理能力。进一步优化的PS+方法引入变量提取和中间计算，将GSM8K数据集准确率提升至69%。研究对比了PS与Re

#深度学习 #人工智能 #机器学习 +1

LLMs-from-scratch学习4

在先前的学习中，我们学习了数据集的准备和注意力机制，在本章中我们可以学习到LLM里面Stage1中最后一步：类GPT LLM架构，可以code一个类GPT模型中的所有组件1.总体code步骤。

#学习 #自然语言处理 #语言模型 +1

Reflexion论文和框架详解（附demo版）

摘要：本文提出Reflexion框架，一种基于语言反思的强化学习范式，通过语言反馈而非参数调整来优化大型语言模型（LLM）智能体的表现。该方法包含三个核心组件：执行任务的演员模型、评估质量的评估器模型和生成语言反馈的自我反思模型。Reflexion利用LLM的文本理解能力，将环境反馈转化为语义梯度指导后续决策，模拟人类通过内省学习的过程。实验表明该方法在编程等任务中表现优异，但也面临数据污染、局部

#python #学习 #人工智能 +1

ReAct的论文思想剖析及demo实现

#python #自然语言处理 #人工智能 +1

LLMs-from-scratch学习2

这里提供了一个后续使用案例raw_text,break在本章中还有一些额外的部分，挖坑后续学完整体继续深入。

#学习 #python #自然语言处理 +1

Reflexion论文和框架详解（附demo版）

#python #学习 #人工智能 +1

LangChain源码分析之JSONLoader

#源代码管理 #json #学习 +1

到底了