logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

大模型三大核心技术揭秘:上下文工程vs提示工程vs微调,小白也能搞懂!

文章详细解析了大模型三大核心技术:上下文工程、提示工程和微调的区别与应用。澄清了上下文工程与RAG的本质差异,介绍了上下文学习(In-Context Learning)原理、One-Shot/Few-Shot学习技术,并强调提示工程是临时挖掘模型潜力而不修改参数,而微调则是通过修改参数永久提升模型能力。掌握这些概念对高效使用大模型至关重要。

文章图片
#人工智能#AI
从原理到实战:AI Agent停止策略全解析,避免无限循环与资源浪费

本文深入探讨了AI Agent停止策略的设计思路与实现方法。AI Agent本质是一个大循环,若无合理停止机制,会导致无限循环浪费资源或过早停止无法完成任务。文章分析了六种常用停止策略:硬性限制、任务完成检测、显式停止信号、循环检测、错误累积和用户中断。结合OpenManus和Gemini CLI的源码,详细展示了如何通过terminate工具、状态机管理、声明式输出系统和三层循环检测机制实现有效

文章图片
#人工智能
让大模型真正“干活“:LangChain与Python MCP集成深度解析,解决开发者6大痛点

本文分析了LangChain与Python MCP集成的六大核心挑战:接口抽象冲突、状态管理不一致、性能损耗、版本兼容性问题、调试困难及安全管控缺口。提出标准化适配、统一状态管理、性能优化等解决方案,强调需平衡灵活性与标准化,根据场景取舍适配层设计。

文章图片
#python#人工智能#AI
MCP协议详解:AI时代大模型与工具交互的标准化解决方案

MCP是Anthropic推出的开放标准协议,旨在解决大模型与外部工具、数据源间的交互壁垒。它采用client-host-server架构,通过标准化通信实现大模型与数据库、文件系统、API等资源的连接。MCP提供Tools、Resources和Prompts三种功能,使AI应用能访问本地文件、数据库和外部API,增强功能并改善用户体验。开发者可借助MCP减少构建AI应用的复杂性,而用户则能获得功

文章图片
#人工智能#transformer
一文彻底搞懂大模型 - RAG(检索、增强、生成)

一文彻底搞懂大模型 - RAG(检索、增强、生成)

文章图片
#人工智能#RAG
从零开始,亲手开发你的第一个AI大模型!(二)MCP实战

从零开始,亲手开发你的第一个AI大模型!(二)MCP实战

文章图片
#人工智能#AI#MCP
大模型微调解读及参数设置实践示例

方法核心思想优点缺点适用场景全量微调(FFT)重新训练所有参数性能提升显著计算资源大,可能遗忘通用知识数据量大、任务复杂训练小型附加参数(提示词)计算成本低,避免遗忘需要设计好的提示词小数据量、多任务场景在输入前加前缀向量高效,适合特定任务需要优化前缀向量任务导向型场景LoRA通过低秩分解添加少量参数快速适应,轻松切换任务需要设计低秩结构多任务、资源有限场景监督式微调(SFT)用带标签的数据训练简

文章图片
#人工智能
什么是大模型?一文读懂大模型的基本概念,看完这篇就足够了~

什么是大模型?一文读懂大模型的基本概念,看完这篇就足够了~

文章图片
#人工智能
什么是RAG?如何将RAG应用于实际业务场景?

大模型(Large Language Model,LLM)的浪潮已经席卷了几乎各行业,但当涉及到专业场景或行业细分领域时,通用大模型就会面临专业知识不足的问题。相对于成本昂贵的“Post Train”或“SFT”,基于RAG的技术方案往往成为一种更优选择。本文从RAG架构入手,详细介绍相关技术细节,并附上一份实践案例。检索增强生成(Retrieval Augmented Generation),简

文章图片
#人工智能#大数据
    共 159 条
  • 1
  • 2
  • 3
  • 16
  • 请选择