• RAG(Retrieval-Augmented Generation):从文档中“找证据再回答”,更适合开放域、时效更新快的场景。

  • KAG(Knowledge-Augmented Generation):把结构化知识(知识图谱/数据库)“融进生成过程”,在实体关系与事实一致性上更稳。

RAG与KAG:主要区别

图片

实战建议:多数业务选 RAG 起步;需要强事实一致性/规则推理时上 KAG;混合(GraphRAG/KG-RAG)能同时兼顾覆盖与可信。

RAG:原理、工程要点与开源实战

  1. 工作流要点

  • 文档管线:清洗 → 分块(保标题层级/表格结构)→ 向量化 → 向量库

  • 检索:向量召回(ANN)+ 重排(Cross-Encoder)+ 上下文压缩

  • 生成:基于证据回答,标注引用/拒答策略

  • 评估:检索命中率、答案一致性、引用可溯源、延迟/成本

  1. 最小可跑示例(FAISS + bge-m3 + 任何LLM)
    依赖:pip install sentence-transformers faiss-cpu

示例仅演示“检索到上下文”,生成可对接任意 LLM(OpenAI/Claude/本地模型)。

# pip install sentence-transformers faiss-cpufrom sentence_transformers import SentenceTransformerimport faiss, numpy as np# 1) 准备文档(示例用三段文本)docs = [    "RAG 通过从外部文档检索证据,再让大模型基于证据生成答案。",    "KAG 侧重结构化知识(知识图谱)注入,强调事实一致性与可控性。",    "GraphRAG 将文档抽取成图谱,再结合图谱结构化检索与生成。"]titles = ["什么是RAG", "什么是KAG", "什么是GraphRAG"]# 2) 向量化(bge-m3 多语模型)embedder = SentenceTransformer("BAAI/bge-m3")embs = embedder.encode(docs, normalize_embeddings=True)dim = embs.shape[1]# 3) 建索引(内积检索)index = faiss.IndexFlatIP(dim)index.add(embs)def retrieve(query, k=2):    q = embedder.encode([query], normalize_embeddings=True)    D, I = index.search(q, k)    return [(titles[i], docs[i], float(D[0][j])) for j, i in enumerate(I[0])]# 4) 查询 + 构造提示(把证据拼进提示)query = "RAG 和 KAG 有什么区别?"hits = retrieve(query, k=2)context = "\n\n".join([f"[{t}] {c}" for t, c, _ in hits])prompt = f"仅依据以下上下文作答,并给出要点对比:\n{context}\n\n问题:{query}"print("拼装的上下文:\n", context)print("\n可将上面 prompt 交给任意 LLM 生成答案(OpenAI/Claude/本地模型)。")

要接 LLM 生成(可选)

  • LlamaIndex 端到端(最省心):LlamaIndex 负责分块、存储、检索、重排与调用 LLM。

    • LlamaIndex Quickstart(RAG):https://docs.llamaindex.ai/en/stable/getting_started/installation/

    • RAG 示例合集:https://docs.llamaindex.ai/en/stable/examples/

  • LangChain QA/RAG 用例文档:https://python.langchain.com/docs/use_cases/question_answering/

  • Haystack RAG 教程与管线(含重排/评估):https://haystack.deepset.ai/

  1. 开源组件选择(常用)

  • 向量库:FAISS(本地)https://github.com/facebookresearch/faiss
    Milvus https://github.com/milvus-io/milvus
    Weaviate https://github.com/weaviate/weaviate
    Chroma https://github.com/chroma-core/chroma

  • 嵌入模型:BAAI/bge-m3(多语)https://huggingface.co/BAAI/bge-m3

  • 重排模型:BAAI/bge-reranker-large https://huggingface.co/BAAI/bge-reranker-large

  • 评估:RAGAS https://github.com/explodinggradients/ragas
    TruLens https://github.com/truera/trulens
    DeepEval https://github.com/confident-ai/deepeval

  1. 可复用实战项目/教程

  • LangChain Cookbook(多种 RAG 玩法)https://github.com/langchain-ai/langchain/tree/master/cookbook

  • Haystack Wikipedia QA 示例:https://haystack.deepset.ai/tutorials

  • LlamaIndex “Chat with your docs” 模板:https://docs.llamaindex.ai/en/stable/understanding/querying/

KAG:原理、工程要点与开源实战

  1. 工作流要点

  • 知识构建:知识图谱/结构化库(实体、关系、属性、来源、时效)

  • 实体识别与链接:把文本里的实体映射到图谱节点

  • 图检索与推理:路径查询、多跳推理、约束查询(Cypher/SPARQL)

  • 知识注入:提示中嵌入三元组/属性卡片、图嵌入、或解码约束

  • 生成:基于结构化事实的可控生成(可带来源)

  1. 最小可跑示例(Neo4j 小图谱 + Cypher 查询 + 把结果交给 LLM)
    依赖:pip install neo4j

# pip install neo4jfrom neo4j import GraphDatabaseURI = "bolt://localhost:7687"    # 你本地 Neo4j,或远程地址AUTH = ("neo4j", "password")     # 修改为你的用户名/密码driver = GraphDatabase.driver(URI, auth=AUTH)with driver.session() as session:    # 1) 建立一个极小知识图谱:Tesla <-[CEO]- Elon Musk    session.run("""    MERGE (c:Company {name:'Tesla'})    MERGE (p:Person {name:'Elon Musk'})    MERGE (p)-[:HOLDS_ROLE {title:'CEO'}]->(c)    """)    # 2) 以自然语言问题为入口,转成 Cypher(这里直接写死规则)    question = "谁是特斯拉的首席执行官?"    cypher = """    MATCH (p:Person)-[r:HOLDS_ROLE {title:'CEO'}]->(c:Company {name:'Tesla'})    RETURN p.name AS person, r.title AS title, c.name AS company    """    result = session.run(cypher).data()driver.close()# 3) 将结构化结果喂给 LLM(这里仅打印;实际你可把 result 拼进提示再生成)print("结构化答案:", result)# -> [{'person': 'Elon Musk', 'title': 'CEO', 'company': 'Tesla'}]

  • 图谱搭建/探索:

    • Neo4j(社区版+桌面管理)https://neo4j.com/

    • Wikidata(真实开放图谱,带 SPARQL)https://www.wikidata.org/

    • SPARQL 在线查询(Wikidata Query Service)https://query.wikidata.org/

  • 图谱与 LLM 集成:

    • Neo4j GenAI 生态与示例合集:https://github.com/neo4j-labs/genai-ecosystem

    • LlamaIndex 知识图谱索引与查询:https://docs.llamaindex.ai/en/stable/examples/knowledge_graph/

  • 图谱嵌入/推理:

    • PyKEEN(知识图谱嵌入)https://github.com/pykeen/pykeen

    • DGL-KE https://github.com/awslabs/dgl-ke

    • RDFLib(RDF 处理)https://github.com/RDFLib/rdflib

  1. 适用场景与实践提醒

  • 适合:实体密集、规则明确、需要溯源一致性的任务(合规校验、设备部件关系、医药/专利实体关系、推荐系统特征联动)。

  • 工程要点:实体链接质量>一切;定义好本体和命名规范;事实需要来源与时间戳;考虑冲突与版本管理。

混合范式(GraphRAG/KG-RAG):把“可用”和“可信”都做强

  • 思路:先从文档中抽取实体/关系构成轻量知识图谱,再进行图结构检索与生成;同时保留原文片段用于溯源。

  • 开源项目

    • Microsoft GraphRAG(从文本构图+分层检索):https://github.com/microsoft/graphrag

    • LlamaIndex KG + 文本 RAG 组合:https://docs.llamaindex.ai/en/stable/examples/knowledge_graph/knowledge_graph_rag/

  • 何时选

    • 文档繁杂且跨域,需要图结构来理清“谁-与谁-什么关系”;但仍需原文引用与时效更新。

评估与监控:把“看起来会”变成“稳定可用”

  • 指标与工具

    • 检索:Top-k 命中率、重排提升、覆盖率(BEIR/自建评测集)

    • 生成:基于证据的正确性(RAGAS/TruLens)、一致性(同问同答)、拒答率

    • 体验与成本:延迟、吞吐、调用费用

  • 资源

    • RAGAS(自动化评估指标与流水线)https://github.com/explodinggradients/ragas

    • TruLens(在线观测/反馈回路)https://github.com/truera/trulens

    • DeepEval(可自定义断言/指标)https://github.com/confident-ai/deepeval

    • BEIR(检索评测基准)https://github.com/beir-cellar/beir

    • HotpotQA(多跳问答)https://hotpotqa.github.io/

    • MS MARCO(真实搜索问答)https://microsoft.github.io/msmarco/

快速选型清单

  • 你的知识主要是文档、更新频繁 → RAG(向量库 + 重排 + 引用)

  • 需要强一致性、图结构推理/约束 → KAG(知识图谱 + 实体链接)

  • 两者都要:关键事实入图谱+规则约束,长尾与时效用检索补齐 → GraphRAG/KG-RAG

想入门 AI 大模型却找不到清晰方向?备考大厂 AI 岗还在四处搜集零散资料?

别再浪费时间啦!2025 年 AI 大模型全套学习资料已整理完毕,从学习路线到面试真题,从工具教程到行业报告,一站式覆盖你的所有需求,现在全部免费分享

👇👇扫码免费领取全部内容👇👇

一、学习必备:100+本大模型电子书+26 份行业报告 + 600+ 套技术PPT,帮你看透 AI 趋势

想了解大模型的行业动态、商业落地案例?大模型电子书?这份资料帮你站在 “行业高度” 学 AI

1. 100+本大模型方向电子书

在这里插入图片描述

2. 26 份行业研究报告:覆盖多领域实践与趋势

报告包含阿里、DeepSeek 等权威机构发布的核心内容,涵盖:

  • 职业趋势:《AI + 职业趋势报告》《中国 AI 人才粮仓模型解析》;
  • 商业落地:《生成式 AI 商业落地白皮书》《AI Agent 应用落地技术白皮书》;
  • 领域细分:《AGI 在金融领域的应用报告》《AI GC 实践案例集》;
  • 行业监测:《2024 年中国大模型季度监测报告》《2025 年中国技术市场发展趋势》。

3. 600+套技术大会 PPT:听行业大咖讲实战

PPT 整理自 2024-2025 年热门技术大会,包含百度、腾讯、字节等企业的一线实践:

在这里插入图片描述

  • 安全方向:《端侧大模型的安全建设》《大模型驱动安全升级(腾讯代码安全实践)》;
  • 产品与创新:《大模型产品如何创新与创收》《AI 时代的新范式:构建 AI 产品》;
  • 多模态与 Agent:《Step-Video 开源模型(视频生成进展)》《Agentic RAG 的现在与未来》;
  • 工程落地:《从原型到生产:AgentOps 加速字节 AI 应用落地》《智能代码助手 CodeFuse 的架构设计》。

二、求职必看:大厂 AI 岗面试 “弹药库”,300 + 真题 + 107 道面经直接抱走

想冲字节、腾讯、阿里、蔚来等大厂 AI 岗?这份面试资料帮你提前 “押题”,拒绝临场慌!

1. 107 道大厂面经:覆盖 Prompt、RAG、大模型应用工程师等热门岗位

面经整理自 2021-2025 年真实面试场景,包含 TPlink、字节、腾讯、蔚来、虾皮、中兴、科大讯飞、京东等企业的高频考题,每道题都附带思路解析

2. 102 道 AI 大模型真题:直击大模型核心考点

针对大模型专属考题,从概念到实践全面覆盖,帮你理清底层逻辑:

3. 97 道 LLMs 真题:聚焦大型语言模型高频问题

专门拆解 LLMs 的核心痛点与解决方案,比如让很多人头疼的 “复读机问题”:


三、路线必明:AI 大模型学习路线图,1 张图理清核心内容

刚接触 AI 大模型,不知道该从哪学起?这份「AI大模型 学习路线图」直接帮你划重点,不用再盲目摸索!

在这里插入图片描述

路线图涵盖 5 大核心板块,从基础到进阶层层递进:一步步带你从入门到进阶,从理论到实战。

img

L1阶段:启航篇丨极速破界AI新时代

L1阶段:了解大模型的基础知识,以及大模型在各个行业的应用和分析,学习理解大模型的核心原理、关键技术以及大模型应用场景。

img

L2阶段:攻坚篇丨RAG开发实战工坊

L2阶段:AI大模型RAG应用开发工程,主要学习RAG检索增强生成:包括Naive RAG、Advanced-RAG以及RAG性能评估,还有GraphRAG在内的多个RAG热门项目的分析。

img

L3阶段:跃迁篇丨Agent智能体架构设计

L3阶段:大模型Agent应用架构进阶实现,主要学习LangChain、 LIamaIndex框架,也会学习到AutoGPT、 MetaGPT等多Agent系统,打造Agent智能体。

img

L4阶段:精进篇丨模型微调与私有化部署

L4阶段:大模型的微调和私有化部署,更加深入的探讨Transformer架构,学习大模型的微调技术,利用DeepSpeed、Lamam Factory等工具快速进行模型微调,并通过Ollama、vLLM等推理部署框架,实现模型的快速部署。

img

L5阶段:专题集丨特训篇 【录播课】

img
四、资料领取:全套内容免费抱走,学 AI 不用再找第二份

不管你是 0 基础想入门 AI 大模型,还是有基础想冲刺大厂、了解行业趋势,这份资料都能满足你!
现在只需按照提示操作,就能免费领取

👇👇扫码免费领取全部内容👇👇

2025 年想抓住 AI 大模型的风口?别犹豫,这份免费资料就是你的 “起跑线”!

Logo

为武汉地区的开发者提供学习、交流和合作的平台。社区聚集了众多技术爱好者和专业人士,涵盖了多个领域,包括人工智能、大数据、云计算、区块链等。社区定期举办技术分享、培训和活动,为开发者提供更多的学习和交流机会。

更多推荐