logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

大模型微调与私有化部署:从零到一完全指南

本文系统介绍了大模型开发的核心流程与关键技术,帮助开发者快速入门。内容涵盖:1)大模型基础概念,包括参数规模、开源与闭源模型对比及选型建议;2)开发五步法(预训练、指令微调、对齐、量化、部署),重点讲解LoRA等实用技术;3)数据准备策略,强调质量优先原则,提供数据格式、来源及多样性建议。文章通过通俗类比(如"装修房子"解释LoRA)降低理解门槛,为不同技术基础的读者提供从理论

HuggingGPT vs RestGPT:让大模型学会“调用工具”的两种经典范式

本文介绍了2023年AI Agent领域的两个代表性工作——HuggingGPT和RestGPT,它们解决了大语言模型(LLM)无法直接执行具体任务的问题。HuggingGPT通过让LLM作为"调度中心",调用HuggingFace平台上的专业AI模型来完成多模态任务;RestGPT则专注于让LLM学会调用现实世界的RESTful API,实现真实应用的操作。两者都基于&quo

深入浅出 LangChain Agent:从人工实现到框架原理

摘要: 本文通过手动实现与LangChain框架对比,解析AI Agent的核心原理。手动实现需处理工具调用、多轮对话等逻辑,而LangChain将其抽象为create_tool_calling_agent(配置阶段)和AgentExecutor(执行阶段)。前者自动生成工具描述并整合Prompt,后者通过循环驱动多轮交互,利用agent_scratchpad记录中间步骤。框架封装了通用流程,开发

HuggingGPT vs RestGPT:让大模型学会“调用工具”的两种经典范式

本文介绍了2023年AI Agent领域的两个代表性工作——HuggingGPT和RestGPT,它们解决了大语言模型(LLM)无法直接执行具体任务的问题。HuggingGPT通过让LLM作为"调度中心",调用HuggingFace平台上的专业AI模型来完成多模态任务;RestGPT则专注于让LLM学会调用现实世界的RESTful API,实现真实应用的操作。两者都基于&quo

LangChain 1.0 实战:手写 Plan-and-Execute Agent 框架

❌ LangChain 0.x 的写法(1.0 已移除)但升级到后,这些函数被移除了!官方建议开发者根据具体需求自定义实现。"""表示计划中的单个步骤"""id: int = Field(..., description="步骤的 ID")description: str = Field(..., description="步骤的描述")

#网络#服务器
深入浅出 LangChain Agent:从人工实现到框架原理

摘要: 本文通过手动实现与LangChain框架对比,解析AI Agent的核心原理。手动实现需处理工具调用、多轮对话等逻辑,而LangChain将其抽象为create_tool_calling_agent(配置阶段)和AgentExecutor(执行阶段)。前者自动生成工具描述并整合Prompt,后者通过循环驱动多轮交互,利用agent_scratchpad记录中间步骤。框架封装了通用流程,开发

Ragas评估四个常用指标解析笔记

本文解析了Ragas评估系统的四个核心指标:忠实度(Faithfulness)、答案相关性(Answer Relevancy)、上下文精确度(Context Precision)。忠实度检查答案陈述是否源自上下文;答案相关性评估答案是否明确具体;上下文精确度判断单个上下文片段对得出答案的有用程度。通过具体示例展示了各指标的prompt指令、判定标准(0/1二元评估)和实际输出,揭示了评估过程中需注

决策树算法详解:从入门到精通

决策树是一种树形结构的监督学习算法,通过一系列特征问题将数据分类或预测。它由根节点、内部节点、分支和叶子节点组成。算法通过计算信息增益或基尼系数选择最佳分裂特征,最大化分类效果。主流算法包括ID3、C4.5、CART和CHAID,其中CART最常用。为防止过拟合,决策树采用预剪枝(限制深度/样本数)和后剪枝(代价复杂度剪枝)技术。基尼系数计算更快,而信息熵对纯度变化更敏感,实际效果相近。决策树直观

#算法#决策树#机器学习
到底了