logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

AI Agent(智能体)的设计模式以及实现机制

从ReAct的即时决策,到的全局规划,再到Reflexion与的自我进化,Agent 设计模式正朝着更自主、更可靠的方向发展。简单任务首选ReAct(成本低、速度快)。复杂工作流采用(可控性强)。高可靠性需求场景(如代码、事实问答)务必引入Reflection机制。未来的 Agent 架构将是这些模式的混合体:一个具备长期记忆(Reflexion)、能全局规划(Plan-and-Execute)、

#设计模式#python#人工智能
大模型底层生成原理(基于Transformer框架)

注意:这里的QK相乘,会得到注意力分数矩阵,这个矩阵里面,每个token只关注自己所在的一行,如果没有位置信息,这个顺序你随意变换是没有任何影响的,有了位置信息你变换位置计算的注意力分数矩阵就会不一样。然后把 "I love" 再喂进去,算出 "AI"。如果位置 1 没预测对 "love",梯度会传回,调整 WQ​,WK​ 等,让 "I" 的向量表示在未来能更倾向于关联到 "love"。,通过反向

#transformer#深度学习#人工智能
AI Agent(智能体)的设计模式以及实现机制

从ReAct的即时决策,到的全局规划,再到Reflexion与的自我进化,Agent 设计模式正朝着更自主、更可靠的方向发展。简单任务首选ReAct(成本低、速度快)。复杂工作流采用(可控性强)。高可靠性需求场景(如代码、事实问答)务必引入Reflection机制。未来的 Agent 架构将是这些模式的混合体:一个具备长期记忆(Reflexion)、能全局规划(Plan-and-Execute)、

#设计模式#python#人工智能
Ragas框架:如何评估以及优化Rag系统

Ragas是一种自动化评估检索增强生成(RAG)系统的框架,结合了大语言模型(LLM)和嵌入模型的优势。它通过四个核心指标进行评估:1)忠实度(Faithfulness)检查答案是否基于上下文;2)答案相关性(Answer Relevancy)衡量回答与问题的匹配度;3)上下文精确性(Context Precision)评估检索内容的相关性;4)上下文召回率(Context Recall)检测关键

#python#人工智能
到底了