简介

Graphiti是一个用于构建和查询时间感知型知识图谱的框架,专为动态环境中的AI智能体设计。它与传统RAG方法不同,能够持续整合用户交互、企业数据和外部信息,形成统一知识图谱,支持增量更新、高效检索和精确历史查询。作为Zep的核心引擎,Graphiti在智能体记忆领域已达最先进水平,提供实时增量更新、双时间数据模型、高效混合检索等功能,非常适合开发交互式、上下文感知的AI应用。


提示:

请查看全新的 Graphiti MCP 服务器[1]! 它能为 Claude、Cursor 以及其他 MCP 客户端提供 基于知识图谱的强大记忆能力

Graphiti 是一个用于构建和查询 时间感知型知识图谱 的框架,专为运行在动态环境中的 AI 智能体而设计。

不同于传统的 RAG(检索增强生成) 方法,Graphiti 能够:

•持续整合 用户交互结构化与非结构化企业数据 以及 外部信息,并形成一个统一、可查询的知识图谱;•支持 增量数据更新高效检索精确的历史查询,而无需完全重新计算整个图谱;•非常适合开发 交互式、上下文感知的 AI 应用

Graphiti 的使用场景

使用 Graphiti,你可以:

•集成并维护 动态的用户交互与业务数据;•支持智能体的 状态推理任务自动化;•借助 语义搜索关键词搜索图谱搜索,查询复杂且不断演变的数据。

知识图谱是一组互相关联的事实网络。
例如:“Kendra 喜欢 Adidas 鞋子”

实体(节点)KendraAdidas shoes关系(边)loves

这样的事实通常以 三元组(triplet) 形式存储。

知识图谱在信息检索领域已有广泛应用,而 Graphiti 的独特之处在于:

•它能 自主构建知识图谱;•能够 处理关系随时间的变化;•并在此过程中 保留历史上下文

Graphiti 与 Zep 的上下文工程平台

Graphiti 是 Zep[2] 的核心引擎。
Zep 是一个开箱即用的 上下文工程平台(Context Engineering Platform),为 AI 智能体提供:

•智能体记忆[3]•Graph RAG(动态图谱检索增强生成)上下文检索与组装

借助 Graphiti,我们证明了 Zep 在智能体记忆领域已达到最先进(SOTA)水平

📖 推荐阅读论文:
《Zep: A Temporal Knowledge Graph Architecture for Agent Memory》[4]

为什么选择 Graphiti?

传统的 RAG 方法通常依赖于 批处理静态数据摘要,在处理频繁变化的数据时效率低下。
Graphiti 针对这些挑战提供了以下解决方案:

实时增量更新:立即整合新数据,无需重新进行批处理计算。•双时间数据模型(Bi-Temporal Data Model):显式追踪事件发生时间和数据摄取时间,支持精确的时间点查询。•高效的混合检索:结合语义向量、关键词(BM25)和图谱遍历,实现低延迟查询,无需依赖 LLM 总结。•自定义实体定义:支持灵活的本体构建,开发者可通过简洁的 Pydantic 模型定义自有实体。•可扩展性:通过并行处理高效管理大规模数据集,适用于企业级环境。

Graphiti 与 GraphRAG 对比

方面 GraphRAG Graphiti
主要用途 静态文档摘要 动态数据管理
数据处理方式 批处理为主 持续的、增量更新
知识结构 实体簇与社区摘要 事件化数据、语义实体、社区
检索方式 顺序 LLM 摘要 混合语义、关键词、图谱检索
适应性
时间处理 基础时间戳追踪 显式双时间追踪
矛盾处理 依赖 LLM 摘要判断 基于时间的边失效(Temporal edge invalidation)
查询延迟 数秒到数十秒 通常为亚秒级延迟
自定义实体类型 不支持 支持,完全可自定义
可扩展性 中等 高,针对大规模数据集优化

Graphiti 专为应对 动态且频繁更新的数据集 而设计,特别适合需要:

•实时交互
•精确历史查询

的应用场景。

一直在更新,更多的大模型学习和面试资料已经上传带到CSDN的官方了,有需要的朋友可以扫描下方二维码免费领取【保证100%免费】👇👇
在这里插入图片描述

安装指南

基本要求

Python:3.10 或更高版本•图数据库(任选其一):•Neo4j 5.26•FalkorDB 1.1.2•Kuzu 0.11.2•Amazon Neptune 数据库集群 或 Neptune Analytics Graph + Amazon OpenSearch Serverless(作为全文检索后端)•OpenAI API Key(Graphiti 默认使用 OpenAI 进行 LLM 推理与向量嵌入)

⚠️ 重要提示

Graphiti 在支持 结构化输出(Structured Output) 的大模型服务(如 OpenAIGemini)上效果最佳。
使用不支持结构化输出的模型,可能会导致:

•输出 schema 错误•数据导入失败

这在使用小模型时尤为明显。

可选配置

额外 LLM 提供商 API Key:•Google Gemini•Anthropic•Groq

💡 提示

安装 Neo4j 最简单的方法是通过 Neo4j Desktop[5],它提供了用户友好的界面来管理 Neo4j 实例和数据库。

如果你希望更快速上手,可以选择使用 FalkorDB(Docker 部署),并立即运行快速示例:

docker run -p 6379:6379-p 3000:3000-it --rm falkordb/falkordb:latest

安装 Graphiti 核心包:

pip install graphiti-core

或使用 uv:

uv add graphiti-core
使用 FalkorDB

如果你计划将 FalkorDB 作为图数据库后端,请安装带有 FalkorDB 扩展的版本:

pip install graphiti-core[falkordb]
使用 Kuzu

如果你计划将 Kuzu 作为图数据库后端,请安装带有 Kuzu 扩展的版本:

pip install graphiti-core[kuzu]
使用 Amazon Neptune

如果你计划将 Amazon Neptune 作为图数据库后端,请安装带有 Neptune 扩展的版本:

pip install graphiti-core[neptune]
安装可选 LLM 提供商支持

Graphiti 也支持额外的大模型(LLM)服务,安装方法如下:

•Anthropic

pip install graphiti-core[anthropic]

•Groq

pip install graphiti-core[groq]

•Google Gemini

pip install graphiti-core[google-genai]
多服务组合安装示例

•同时安装 多个 LLM 提供商:

pip install graphiti-core[anthropic,groq,google-genai]

•安装 FalkorDB + LLM 提供商:

pip install graphiti-core[falkordb,anthropic,google-genai]

•安装 Amazon Neptune(支持云端图数据库):

pip install graphiti-core[neptune]

默认低并发与 LLM 提供商 429 速率限制错误

Graphiti 的数据导入管道设计为支持高并发。
但为了避免 LLM 提供商返回 429(请求过多)错误,默认情况下并发数设置较低。

•默认并发控制由环境变量 SEMAPHORE_LIMIT 管理。•默认值:10 个并发操作,用于帮助防止触发 LLM 提供商的速率限制。•如果仍然遇到 429 错误,请尝试降低该值。•如果你的 LLM 提供商允许更高吞吐量,可以适当提高 SEMAPHORE_LIMIT 来提升数据导入性能。

快速开始

⚠️ 重要提示

Graphiti 默认使用 OpenAI 进行 LLM 推理与嵌入。 因此需要在环境变量中设置 OPENAI_API_KEY

此外,Graphiti 也支持:

•Anthropic•Groq

其他 LLM 提供商也可能通过 OpenAI 兼容 API 接入。

Quickstart 示例

完整可运行示例可在 examples 目录下的 Quickstart Example[6] 找到。
该示例展示了以下功能:

1.连接到 Neo4j / Amazon Neptune / FalkorDB / Kuzu 数据库2.初始化 Graphiti 的索引和约束3.向图谱中添加数据片段(支持文本和结构化 JSON)4.使用 混合检索 搜索关系(edges)5.基于 图距离 对搜索结果进行重排序6.使用预定义的搜索方案(recipes)查找节点(nodes)

该示例附带了完整的文档说明,包括:

•每个功能的清晰解释•完整的 README(安装说明 + 下一步操作指引)

💡 建议:如果你发现 Graphiti 运行缓慢,请根据 LLM 提供商的实际限额,适当调整 SEMAPHORE_LIMIT,以获得最佳性能。

MCP 服务器

mcp_server 目录包含了 Graphiti 的 Model Context Protocol (MCP) 服务器实现。
该服务器允许 AI 助手 通过 MCP 协议与 Graphiti 的知识图谱能力交互。

MCP 服务器的主要功能:

•数据片段(Episode)管理:新增、获取、删除•实体与关系管理•语义搜索与混合检索•分组管理:用于组织相关数据•图谱维护操作

MCP 服务器可以通过 Docker 部署并连接 Neo4j,从而轻松集成到 AI 助手工作流中。
👉 详细安装步骤与使用示例,请查看 MCP Server README[7]。

REST 服务

server 目录包含了一个用于与 Graphiti API 交互的 API 服务,基于 FastAPI 构建。
👉 详细信息请查看 Server README[8]。

可选环境变量

除了 Neo4j与 OpenAI 兼容凭据 之外,Graphiti 还支持一些 可选环境变量。

•如果你使用 Anthropic 或 Voyage等支持的模型,需要设置对应的环境变量。

数据库配置

数据库名称在 驱动(driver)构造函数 中直接配置:

Neo4j:默认数据库名为 neo4j(硬编码在 Neo4jDriver 中)•FalkorDB:默认数据库名为 default_db(硬编码在 FalkorDriver 中)

自 v0.17.0 起,如需自定义数据库配置,可在实例化 Graphiti 时通过 graph_driver 参数传入数据库驱动。

Neo4j 自定义数据库名称
from graphiti_core importGraphiti
FalkorDB 自定义数据库名称
from graphiti_core importGraphiti
Kuzu
from graphiti_core importGraphiti
Amazon Neptune
from graphiti_core importGraphiti

性能配置

USE_PARALLEL_RUNTIME 是一个可选的布尔变量。
如果设置为 true,则会启用 Neo4j 的并行运行时(parallel runtime),以提升部分搜索查询的性能。

⚠️ 注意:

•此功能 不支持 Neo4j Community Edition•对于较小的 AuraDB 实例 也不支持
因此默认情况下该功能为关闭状态。

在 Azure OpenAI 中使用 Graphiti

Graphiti 支持在 Azure OpenAI 上进行 LLM 推理向量嵌入。 Azure 部署通常需要:

不同的端点 分别用于 LLM 与 Embedding 服务•针对默认模型和小模型进行 独立部署

⚠️ 重要提示

Azure OpenAI v1 API 结构化输出需要手动启用

Graphiti 使用结构化输出(client.beta.chat.completions.parse() 方法)。这要求 Azure OpenAI 部署 必须选择加入 v1 API。否则,在数据导入(episode ingestion)时会遇到:404 Resource not found

👉 启用方法:请参考微软官方文档 Azure OpenAI API version lifecycle[9]

使用示例
from openai importAsyncAzureOpenAI

请务必将示例代码中的占位符(如 <your-google-api-key>、模型名等)替换为你在 Azure OpenAIGoogle Gemini 服务中实际的 凭据与部署名称

在 Google Gemini 中使用 Graphiti

Graphiti 支持 Google Gemini 模型,可用于:

•LLM 推理•向量嵌入(embeddings)•交叉编码 / 结果重排序(cross-encoding / reranking)

安装 Graphiti(启用 Google Gemini 支持)
uv add"graphiti-core[google-genai]"

使用示例

from graphiti_core importGraphiti
关于 Gemini Reranker

•默认使用 gemini-2.5-flash-lite-preview-06-17 模型•该模型针对 低成本低延迟分类任务 进行了优化•使用与 OpenAI Reranker 相同的 布尔分类方法•借助 Gemini 的 log probabilities 特性 对段落相关性进行排序

在 Ollama(本地 LLM)中使用 Graphiti

Graphiti 支持通过 Ollama 的 OpenAI 兼容 API来运行本地的大语言模型(LLM)和嵌入模型。
这种方式非常适合:

•注重隐私的应用场景•避免额外 API 成本的场景

安装模型

# 拉取 LLM 模型
使用示例
from graphiti_core importGraphiti

确保 Ollama 已经运行(ollama serve),确认已拉取所需模型(例如 deepseek-r1:7bnomic-embed-text)。

文档与指南

•Guides:使用手册与 API 文档[10]•Quick Start:快速开始[11]•与 LangChain 的 LangGraph 集成:使用 Graphiti 构建智能体[12]

遥测(Telemetry)

Graphiti 会收集匿名使用统计信息,以帮助我们了解框架的使用情况并改进功能。
我们重视透明性,明确具体收集的内容不会收集的内容

查看遥测代码

遥测相关代码可在 这里[13] 查看。

如何禁用遥测

Graphiti 的遥测为 默认启用(opt-out),可随时关闭。

方法 1:通过环境变量
exportGRAPHITI_TELEMETRY_ENABLED=false
方法 2:写入 Shell 配置文件

Bash 用户 (~/.bashrc~/.bash_profile)

echo'export GRAPHITI_TELEMETRY_ENABLED=false'>>~/.bashrc

Zsh 用户 (~/.zshrc)

echo'export GRAPHITI_TELEMETRY_ENABLED=false'>>~/.zshrc
方法 3:在单个 Python 会话中禁用
import os

📌 注意:在运行测试时(检测到 pytest),遥测会自动禁用。

技术细节

•遥测使用 PostHog 进行匿名数据收集•所有遥测操作均设计为 静默失败(fail silently)•不会中断应用•不会影响 Graphiti 功能•匿名 ID 仅存储在本地,与任何个人信息无关

👉 详细的代码贡献指南,请参阅 CONTRIBUTING[14]。

https://github.com/getzep/graphiti

如何学习大模型 AI ?

由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。

但是具体到个人,只能说是:

“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。

这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

一直在更新,更多的大模型学习和面试资料已经上传带到CSDN的官方了,有需要的朋友可以扫描下方二维码免费领取【保证100%免费】👇👇

01.大模型风口已至:月薪30K+的AI岗正在批量诞生

在这里插入图片描述

2025年大模型应用呈现爆发式增长,根据工信部最新数据:

国内大模型相关岗位缺口达47万

初级工程师平均薪资28K(数据来源:BOSS直聘报告)

70%企业存在"能用模型不会调优"的痛点

真实案例:某二本机械专业学员,通过4个月系统学习,成功拿到某AI医疗公司大模型优化岗offer,薪资直接翻3倍!

02.如何学习大模型 AI ?

🔥AI取代的不是人类,而是不会用AI的人!麦肯锡最新报告显示:掌握AI工具的从业者生产效率提升47%,薪资溢价达34%!🚀

由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。

但是具体到个人,只能说是:

“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。

这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

1️⃣ 提示词工程:把ChatGPT从玩具变成生产工具
2️⃣ RAG系统:让大模型精准输出行业知识
3️⃣ 智能体开发:用AutoGPT打造24小时数字员工

📦熬了三个大夜整理的《AI进化工具包》送你:
✔️ 大厂内部LLM落地手册(含58个真实案例)
✔️ 提示词设计模板库(覆盖12大应用场景)
✔️ 私藏学习路径图(0基础到项目实战仅需90天)

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

第一阶段(10天):初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。

  • 大模型 AI 能干什么?
  • 大模型是怎样获得「智能」的?
  • 用好 AI 的核心心法
  • 大模型应用业务架构
  • 大模型应用技术架构
  • 代码示例:向 GPT-3.5 灌入新知识
  • 提示工程的意义和核心思想
  • Prompt 典型构成
  • 指令调优方法论
  • 思维链和思维树
  • Prompt 攻击和防范

第二阶段(30天):高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。

  • 为什么要做 RAG
  • 搭建一个简单的 ChatPDF
  • 检索的基础概念
  • 什么是向量表示(Embeddings)
  • 向量数据库与向量检索
  • 基于向量检索的 RAG
  • 搭建 RAG 系统的扩展知识
  • 混合检索与 RAG-Fusion 简介
  • 向量模型本地部署

第三阶段(30天):模型训练

恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。

到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?

  • 为什么要做 RAG
  • 什么是模型
  • 什么是模型训练
  • 求解器 & 损失函数简介
  • 小实验2:手写一个简单的神经网络并训练它
  • 什么是训练/预训练/微调/轻量化微调
  • Transformer结构简介
  • 轻量化微调
  • 实验数据集的构建

第四阶段(20天):商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。

  • 硬件选型
  • 带你了解全球大模型
  • 使用国产大模型服务
  • 搭建 OpenAI 代理
  • 热身:基于阿里云 PAI 部署 Stable Diffusion
  • 在本地计算机运行大模型
  • 大模型的私有化部署
  • 基于 vLLM 部署大模型
  • 案例:如何优雅地在阿里云私有部署开源大模型
  • 部署一套开源 LLM 项目
  • 内容安全
  • 互联网信息服务算法备案

学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。

如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

在这里插入图片描述

Logo

更多推荐