【无标题】

大模型、AI智能体、记忆功能、LangGraph、CrewAI、Mem0、Milvus

sneilgao

580人浏览 · 2025-09-25 18:12:32

sneilgao · 2025-09-25 18:12:32 发布

构建大模型记忆系统：基于AI智能体的实践探索

标签：大模型、AI智能体、记忆功能、LangGraph、CrewAI、Mem0、Milvus

引言

在当今AI时代，大模型（Large Language Models, LLM）如GPT系列或Llama，已成为智能应用的基石。然而，LLM天生面临上下文长度限制的问题：它们容易“健忘”，无法有效保留历史交互或用户偏好。这就是为什么记忆功能如此重要——它能让AI像人类一样“记住”过去，提升响应准确性和个性化体验。

想象一下，一个智能客服机器人，如果能记住用户的上一次咨询、偏好和关键实体（如姓名或地址），它将变得多么高效！本文将探讨如何创作一个关于大模型记忆功能的博客，但更重要的是，我们将通过实际案例分享构建方法：使用LangGraph或CrewAI作为AI智能体框架，Mem0作为记忆引擎，Milvus作为向量数据库，设计一套兼容短期记忆、长期记忆、实体记忆和用户画像的系统，并实现自动更新。

目标读者是中级开发者，我们将从基础概念入手，逐步深入实践。准备好你的Python环境，让我们开始吧！

大模型记忆功能的基础概念

大模型的记忆功能本质上是模拟人类记忆机制，帮助AI处理和检索信息。LLM本身无状态（stateless），每次交互都从零开始，因此需要外部系统来存储和管理系统状态。

记忆类型详解

短期记忆：类似于RAM，用于临时存储最近的交互数据（如当前对话轮次）。它快速访问，但易丢失。
长期记忆：类似于硬盘，持久化历史信息，支持跨会话检索。例如，存储用户过去的查询和响应。
实体记忆：专注于提取和存储特定实体，如人名、地点或产品。通过命名实体识别（NER），AI能快速回忆相关细节。
用户画像：基于交互构建的用户行为模型，包括偏好、习惯和上下文（如“喜欢科技新闻的用户”）。这有助于个性化推荐。

记忆更新的必要性

记忆不是静态的，必须自动更新以保持相关性。例如，每轮交互后，系统应检测新信息、生成嵌入向量，并插入数据库。否则，记忆会过时，导致AI响应偏差。

向量数据库的作用

向量数据库如Milvus，用于高效存储和检索高维嵌入向量（embeddings）。它支持相似性搜索（e.g., ANN算法），让AI快速找到相关记忆。相比传统数据库，Milvus在规模化场景下性能卓越。

通过这些概念，我们可以看到记忆系统是LLM的“外部大脑”，接下来探讨其在AI智能体中的应用。

AI智能体中的记忆应用

AI智能体（AI Agents）是LLM的扩展形式，能自主执行任务。框架如LangGraph（基于图结构的流程管理）和CrewAI（多智能体协作）让构建复杂系统变得简单。

AI智能体框架概述

LangGraph：将智能体建模为状态图（state graph），适合定义工作流，如“接收输入 → 查询记忆 → 生成响应”。
CrewAI：强调多智能体分工，例如一个“记忆管理智能体”负责更新数据，其他智能体处理任务。

记忆集成方式

在智能体中，Mem0作为记忆引擎，能无缝管理多种记忆类型。它提供API来添加、检索和更新记忆，而Milvus则作为后端存储嵌入。举例：一个无记忆智能体可能重复回答相同问题，而有记忆的版本能引用历史：“根据您上周的查询，我推荐这个产品。”

无记忆 vs. 有记忆的优势

无记忆：响应通用，但缺乏上下文（准确率低）。
有记忆：提升个性化（e.g., 准确率提升30%），适用于客服、推荐等场景。通过实践，我们看到记忆让智能体从“工具”变成“伙伴”。

接下来，我们进入核心：一个实际案例设计。

实践案例设计

案例场景描述

我们构建一个智能客服系统，支持多轮对话。用户可咨询产品，系统记住历史、实体（如用户名）和画像（如偏好科技产品），并自动更新记忆。工具栈：LangGraph/CrewAI for 智能体，Mem0 for 记忆管理，Milvus for 向量存储。

系统架构

系统兼容多种记忆：

数据结构：使用JSON schema整合（e.g., {“type”: “short_term”, “content”: “…”, “embedding”: vector}）。
自动更新：每轮交互后，用LLM生成新嵌入，插入Milvus；Mem0监控变化，更新用户画像。

以下是流程图：
在这里插入图片描述

步骤分解

安装和配置：
- 安装依赖：pip install langgraph crewai mem0ai pymilvus openai（假设使用OpenAI for embeddings）。
- 配置Milvus：启动本地服务器（docker run -p 19530:19530 milvusdb/milvus）。
实现记忆存储和检索：
- Mem0管理记忆类型，Milvus存储向量。

示例代码
以下是核心Python代码逻辑（简化版，使用LangGraph集成）。假设你有OpenAI API密钥。

import os
from langgraph.graph import StateGraph, START, END
from mem0 import MemoryClient
from pymilvus import connections, Collection, CollectionSchema, FieldSchema, DataType
from openai import OpenAI

# 配置
os.environ["OPENAI_API_KEY"] = "your-api-key"
client = OpenAI()
memory = MemoryClient(api_key="your-mem0-key")

# Milvus 配置
connections.connect("default", host="localhost", port="19530")
fields = [
    FieldSchema(name="id", dtype=DataType.INT64, is_primary=True),
    FieldSchema(name="embedding", dtype=DataType.FLOAT_VECTOR, dim=1536),  # OpenAI embedding dim
    FieldSchema(name="metadata", dtype=DataType.JSON)
]
schema = CollectionSchema(fields)
collection = Collection("memory_db", schema)
collection.create_index(field_name="embedding", index_params={"index_type": "IVF_FLAT", "metric_type": "L2", "params": {"nlist": 128}})

# 状态定义（LangGraph）
class State:
    def __init__(self):
        self.input = ""
        self.memory_data = {}
        self.response = ""

# 节点函数
def retrieve_memory(state):
    # 从Mem0检索
    mem_data = memory.search(query=state.input, user_id="user123")
    # 从Milvus搜索相似向量
    embedding = client.embeddings.create(input=state.input, model="text-embedding-ada-002").data[0].embedding
    search_params = {"metric_type": "L2", "params": {"nprobe": 10}}
    results = collection.search([embedding], "embedding", search_params, limit=5, output_fields=["metadata"])
    state.memory_data = {"short_term": mem_data.get("short_term", []), "long_term": results}  # 整合记忆
    return state

def generate_response(state):
    # 使用LLM生成响应（简化）
    prompt = f"基于记忆: {state.memory_data}, 响应: {state.input}"
    state.response = client.chat.completions.create(model="gpt-4", messages=[{"role": "user", "content": prompt}]).choices[0].message.content
    return state

def update_memory(state):
    # 自动更新：生成新嵌入，插入Milvus
    new_embedding = client.embeddings.create(input=state.response, model="text-embedding-ada-002").data[0].embedding
    metadata = {"type": "long_term", "user_profile": "tech_enthusiast", "entities": ["product_X"]}
    entities = [[next_id], [new_embedding], [metadata]]  # 假设next_id自增
    collection.insert(entities)
    # 更新Mem0
    memory.add({"content": state.response, "type": "short_term"}, user_id="user123")
    return state

# 构建图
graph = StateGraph(State)
graph.add_node("retrieve", retrieve_memory)
graph.add_node("generate", generate_response)
graph.add_node("update", update_memory)
graph.add_edge(START, "retrieve")
graph.add_edge("retrieve", "generate")
graph.add_edge("generate", "update")
graph.add_edge("update", END)

# 运行示例
state = State()
state.input = "推荐一款手机"
result = graph.compile().invoke(state)
print(result.response)

此代码实现检索 → 生成 → 更新循环。兼容记忆类型：Mem0处理短期/实体，Milvus存储长期向量，用户画像通过metadata整合。

测试场景
- 输入：“推荐一款手机” → 检索历史偏好 → 响应个性化建议 → 更新记忆。
- 多轮：后续输入引用实体，展示记忆效果。

潜在挑战与解决方案

挑战：数据隐私 → 使用加密和用户同意。
解决方案：性能优化 → 选择高效索引；规模化 → 分布式Milvus。

最佳实践与扩展

优化技巧：定期清理过期记忆；使用HNSW索引提升Milvus搜索速度。
扩展应用：应用于推荐系统（e.g., 电商）或虚拟助手（e.g., 整合多模态数据）。
未来展望：随着多模态LLM兴起，记忆将支持图像/音频嵌入，开启新可能。

参考文献

Mem0文档：https://docs.mem0.ai
Milvus官网：https://milvus.io
LangGraph：https://langchain-ai.github.io/langgraph/
CrewAI：https://docs.crewai.com
论文：“Memory-Augmented Large Language Models” (相关研究)

武汉城市开发者社区

为武汉地区的开发者提供学习、交流和合作的平台。社区聚集了众多技术爱好者和专业人士，涵盖了多个领域，包括人工智能、大数据、云计算、区块链等。社区定期举办技术分享、培训和活动，为开发者提供更多的学习和交流机会。

更多推荐

吴亚洲：企业AI落地的关键——从幻觉走向可靠的工业级 AI标准

武汉城市开发者社区

高通骁龙8精英版第五代发布，游戏与AI性能大幅升级

武汉城市开发者社区

商业建筑空调能耗优化：AI应用架构师用智能体实现按需供应的技巧

按需供应的目标是在满足用户舒适度的前提下，最小化空调能耗。需求的动态性：人员数量、活动类型（如会议、办公）、环境因素（如太阳辐射、室外温度）时刻变化；供给的约束性：空调系统的响应速度（如压缩机启动时间）、设备容量（如冷量输出上限）、能源成本（如峰谷电价）限制了供给的灵活性；舒适度的主观性：不同用户对温度、湿度的偏好差异大（如有人喜欢24℃，有人喜欢26℃），如何平衡群体需求与个体差异是关键。商业建