MrGaoogy 个人主页

MrGaoogy

2022-11-08 17:30:59 加入 DevPress

简介

该用户还未填写简介

未填写擅长的技术栈

暂无可提供的服务

本文是【企业级知识库与智能问答实战系列】第3篇，聚焦“标签体系设计”的实战策略。你将了解到：标签和元数据的区别、标签系统的作用、设计维度与命名规范、打标策略与自动化工具，并结合向量检索+大模型问答的使用场景，真正打通知识库构建的中间桥梁环节。

系统讲解知识库、向量库、智能体这三个核心模块在 RAG 架构中的角色与功能，帮助大家把“概念”真正拆解成可落地的系统设计。

本文是【企业级知识库与智能问答实战系列】第4篇，聚焦如何构建面向问答系统的企业级向量数据库，详细讲解文本切片、向量化、元数据组织、相似度检索及其与大模型问答的配合方式。

盘点和对比免费 / 开源的RAG工具，并结合场景给出推荐建议，适合想要搭建自己知识库问答系统的同学参考。

本文全面解析大模型优化技术，包括模型压缩（蒸馏、剪枝、量化）与推理加速（TensorRT）、输出控制（解码策略），结合类比说明 + 实战流程，适合部署工程师与模型训练者参考。

近年来，“生成式人工智能（GenAI）”火遍全网，但很多人对它和 AIGC、多模态、AI Agent 的关系依然混淆。

本文是【企业级知识库与智能问答实战系列】第5篇，将以实战视角梳理整个企业内部知识库搭建的完整链路。无论你来自 HR、IT、运营还是 AI 平台部门，这篇文章都可以作为「RAG系统落地指南」，助你从规章文档一步步走向智能问答系统的构建。

系统讲解知识库、向量库、智能体这三个核心模块在 RAG 架构中的角色与功能，帮助大家把“概念”真正拆解成可落地的系统设计。

介绍 PyTorch 和 TensorFlow 的基础功能、CUDA 的 GPU 加速机制、以及本地环境配置与常见 IDE 问题解决方案，适合初学者与 AI 工程转型者阅读。

本文深入解析高性能计算中的分布式训练方法，涵盖数据并行、模型并行（张量并行、流水线并行）、主流训练框架（PyTorch DDP、DeepSpeed、Horovod）、混合精度训练（FP16/BF16）与计算图优化策略。

共 12 条

请选择