logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

LLM上下文工程研究综述:从基础到前沿看这篇就够了

这篇160多页的研究论文全面综述了大型语言模型(LLM)上下文工程领域的最新进展。论文构建了系统分类框架,涵盖基础组件、系统实现、评估方法和未来方向四大维度,梳理了2020-2025年从基础RAG到多智能体架构的发展历程。重点分析了提示工程与上下文工程的本质区别,详细探讨了上下文检索、处理、管理等核心组件,以及RAG架构、记忆系统、工具集成等关键技术。特别介绍了上下文自优化、长链推理处理等前沿方法

文章图片
#人工智能#语言模型
LLM上下文工程研究综述:从基础到前沿看这篇就够了

这篇160多页的研究论文全面综述了大型语言模型(LLM)上下文工程领域的最新进展。论文构建了系统分类框架,涵盖基础组件、系统实现、评估方法和未来方向四大维度,梳理了2020-2025年从基础RAG到多智能体架构的发展历程。重点分析了提示工程与上下文工程的本质区别,详细探讨了上下文检索、处理、管理等核心组件,以及RAG架构、记忆系统、工具集成等关键技术。特别介绍了上下文自优化、长链推理处理等前沿方法

文章图片
#人工智能#语言模型
Mutil-Agent的终极秘密武器:上下文工程(Context Engineering)

摘要: 随着大语言模型(LLM)和代理框架的发展,“上下文工程”成为优化代理性能的关键技术。它通过动态管理系统性地为代理提供必要信息与工具,克服长上下文导致的成本、效率及失败模式问题。核心策略包括:写入(持久化外部存储)、选择(精准提取相关记忆)、压缩(摘要或修剪冗余内容)和隔离(多代理分工或沙盒环境)。研究显示,单代理配合压缩技术通常更可靠,而多代理仅适用于高价值并行任务。LangChain、A

文章图片
#人工智能#语言模型
AI笔记:大白话说什么是模型?什么是神经网络?

摘要 本文用通俗易懂的语言解释了模型、大模型和神经网络的基本概念。模型由架构(公式/结构)和参数组成,通过数据训练后可用于预测或分类任务。大模型(如大语言模型LLM)具有海量数据、庞大参数和强大算力的特点。神经网络作为一种模型架构,通过输入层、隐藏层和输出层处理复杂问题,其中隐藏层特征提取过程具有"黑盒"特性。文章还以MNIST手写数字识别为例,展示了神经网络的实际应用。最后,

文章图片
#人工智能#神经网络#语言模型
MCP-Use:让AI智能体轻松调用任何工具的开源神器

MCP-Use是一个开源Python库,通过MCP协议连接大语言模型与外部工具,使AI智能体具备执行实际任务的能力。它支持主流大语言模型,提供多服务器管理、实时流式输出、沙箱安全执行等功能,简化了AI工具调用开发流程。文章介绍了MCP协议原理、MCP-Use核心优势,并提供了从环境配置到高级应用的完整教程,包括旅行助手、3D建模等实际案例,以及调试优化和扩展开发技巧。MCP-Use让AI从回答问题

文章图片
#人工智能#语言模型
常见的几种token过期后的续期方案分别是什么?

本文探讨了前后端分离模式下Token续期的五种方案:1)粗暴型跳转登录页;2)前端请求刷新Token;3)服务端每次请求刷新Token;4)Redis记录过期时间;5)双Token机制。重点推荐双Token机制,通过设置长短两个Token区分活跃用户,实现优雅续期。文章最后附带AI大模型学习资料推广。

文章图片
#人工智能#大数据
手把手实战:用 Mem0 整合 LangGraph 和 Dify,为你的 AI Agent 注入持久记忆

Mem0是一款创新的AI记忆层系统,解决了传统AI对话需重复自我介绍的痛点。它通过多级记忆架构(用户级、会话级、智能体级)实现跨应用记忆共享,采用向量嵌入和图数据库技术高效存储检索信息。核心功能包括自动提取关键对话内容、冲突检测与解决、多维度语义搜索,支持本地化部署确保隐私安全。相比OpenAI方案,Mem0速度快10倍且准确率高26%,已开源并应用于Claude、Cursor等工具,让AI交互更

文章图片
#人工智能#语言模型
回归基础,stable diffusion基本概念介绍!

稳定扩散(Stable Diffusion)具有多种用途,可以以多种不同的方式使用。首先,让我们着重介绍从文本生成图像(text2img)方面。上面的图片展示了一个文本输入的示例以及生成的图像结果。除了文本到图像的转换,另一种主要的使用方式是通过使其修改图像(输入为文本+图像)。稳定扩散是由多个组件和模型组成的系统,而不是一个整体的模型。当我们深入了解其内部机制时,首先可以观察到一个文本理解组件,

文章图片
#AI作画#人工智能
大语言模型之外,“世界模型”新概念

AI领域正从大语言模型(LLM)转向“世界模型”研究,该技术旨在模拟现实世界的物理和空间动态,应用于机器人、自动驾驶等领域。NVIDIA视其为通用机器人的关键,学术圈则从Richard Sutton的Dyna架构到Google的《World Models》论文逐步发展。Yann LeCun认为世界模型是AI自主智能的核心,Meta的V-JEPA 2验证了其潜力。随着AI人才需求激增,学习大模型成为

文章图片
#语言模型#人工智能#自然语言处理
Stable diffusion 如何做出媲美单反效果的摄影照片!一键生成极致人像!

**TIME时光4-极致人像**模型全单反人像照片训练有着更加真实的皮肤\[纹理\]和细致的汗毛,毛孔式构成皮肤,不同于MJ的网格式构成,不惧超特写镜头,解决许多模型超近特写脸变形的毛病,还原真实皮肤和漂亮的眼神光。为美妆,时装,护肤品,等提供虚拟棚拍大片。更加准确的肢体动作,对舞蹈,运动的态姿有良好的出片率。拥有更具胶片感的画质,真正单反级的光影表现。对胶卷,相机,镜头,景深,感光等摄影tag,

文章图片
#AI作画#人工智能
    共 138 条
  • 1
  • 2
  • 3
  • 14
  • 请选择