
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
FileSystem 中间件为 Agent 赋予文件管理能力,通过四种后端实现不同层级的记忆:StateBackend(线程级短期记忆)、StoreBackend(跨线程长期记忆)、FileSystemBackend(本地磁盘持久化)和 CompositeBackend(混合路由),从而灵活应对从临时草稿到长期记忆的存储需求,有效管理上下文窗口。

本期介绍ToolSelector与TodoList中间件:ToolSelector智能筛选相关工具;TodoList自动拆解子任务并维护状态,二者共同提升LangChain DeepAgents处理复杂任务的性能。

本篇以EasyDataset为例,系统讲解大模型预训练数据集的构建流程:从安装配置、文本分块(多种策略)、数据清洗到领域标签生成,最终导出预训练数据,为初学者提供从原始文档到高质量数据集的完整实践。

本文深入讲解LangChain DeepAgents内置的Summarization中间件,它能自动压缩对话历史,解决大模型上下文窗口限制问题。通过配置trigger(触发条件)、keep(保留最新消息)、model(摘要模型)等参数,中间件在达到阈值时将旧消息摘要并重组列表。支持消息数、token数、占比等多条件触发,可自定义摘要提示词,为Agent记忆“做减法”,助力高效处理长任务。

DeepAgents是LangChain团队开发的框架,封装任务规划、子代理管理、文件系统等通用能力,通过create_deep_agent函数让开发者仅需数行代码即可构建复杂智能体,实现搭积木式开发

Qwen3.5-397B-A17B是除夕夜开源的全球最强原生多模态模型,支持图像/视频输入,对话、编程、Agent构建等能力追平GPT-5.2。采用极致稀疏MoE架构(17B激活参数),性能超越Qwen3-Max,显存降低60%、吞吐提升19倍。

本文以DeepSeek-OCR-2为例,详解其核心特性、本地部署及vLLM推理实战。并延伸后处理策略,涵盖数据清洗、RAG优化到多模态检索,打通从“读出来”到“用起来”的全链路,为高质量数据集构建提供实战指南。

本文以DeepSeek-OCR-2为例,详解其核心特性、本地部署及vLLM推理实战。并延伸后处理策略,涵盖数据清洗、RAG优化到多模态检索,打通从“读出来”到“用起来”的全链路,为高质量数据集构建提供实战指南。

本篇重点分享了网络架构及其典型实现Swarm架构的特点,并结合代码示例展示了如何利用langgraph-swarm库构建具备动态移交能力的智能体协作网络。

大模型训练是深入AI核心、从技术使用者迈向创造者的关键一步。它不仅赋能垂直领域创新,更是构建个人长期竞争力的硬核技能。无论是企业智能赋能还是研究生学术界的创新点构思,大模型训练都是大家追逐AI浪潮的必备技能,本合集将系统拆解从数据处理、模型训练到强化学习与智能体开发的全流程,并带你从零实现模型,大家掌握大模型训练的全技能,真正掌握塑造智能的能力!









