
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
文章详解大模型分布式训练三大策略:数据并行、模型并行和混合并行,包括核心逻辑、实操案例和优缺点。对比PyTorch、DeepSpeed、Megatron-LM三大框架配置与性能,介绍FlashAttention-2等前沿技术。提供不同规模团队策略选择和框架建议,助力高效训练大模型。

本文详细探讨了基于大模型的Text2SQL系统在企业应用中的四大挑战:数据准确性、Schema理解、性能成本安全及可解释性,并提出了针对性解决方案。作者分享了达到90%准确率的实战经验,强调RAG检索增强、语义层构建、权限控制及后处理优化等技术的综合应用是实现高准确率Text2SQL系统的关键,指出这不仅是简单Prompt工程,而是需要多种技术深度整合的复杂系统工程。

文章阐述了从提示词到提示词工程再到上下文工程的演变过程,介绍了上下文工程在大模型应用中的核心地位。详细解析了5种上下文编排模式,分析了各自优缺点,并指出上下文工程与经典神经网络结构的相似性。上下文工程涉及上下文的获取、保留、压缩和隔离等问题,是构建高效Agentic AI应用的关键技术,代表了AI架构上思考方式的转变。

“RAG的本质是高效检索,而知识库,向量数据库和知识图谱只是组织数据的一种形式”这两天在之前的一篇关于RAG检索增强的文章中有一个评论,问RAG和知识图谱的区别;这时才发现,原来很多人对RAG技术还没有一个本质的认识,以及与其相关的本地知识库,向量数据库等。所以,今天就来介绍一下上面的这些概念,以及其联系与区别。

生成式AI中常说的token是什么?嵌入(Embeddings)是什么意思?为什么现在的AI具有生成能力?AI是怎么和你进行对话的?为什么都说提示词很重要?为什么同一段提示词,同一个AI模型/工具,多问几次可能得到截然不同的结果?要回答以上这些问题,你需要了解大语言模型(LLM)是如何工作的。知其然,也要知其所以然。

在本教程中,我们将会研究 LangChain 的细节,这是一个利用语言模型开发应用程序的框架。首先,我们会介绍有关语言模型的基本概念,这将对本教程有一定的辅助作用。尽管 LangChain 主要提供了 Python 和 JavaScript/TypeScript 语言的版本,但是也有在 Java 中使用 LangChain 的可选方案。我们将会讨论组成 LangChain 框架的构建基块,然后在

推荐一本全面介绍大语言模型技术的书籍——《大语言模型》,它不仅涵盖了基础原理和关键技术,还展望了技术的未来应用前景。本书主要面向希望系统学习大语言模型技术的读者,将重点突出核心概念与算法,并且配以示例与代码(伪代码)帮助读者理解特定算法的实现逻辑。由于大语言模型技术的快速更迭,本书无法覆盖所有相关内容,旨在梳理最具代表性的基础知识内容,帮助读者更好地了解大语言模型技术的核心知识点,能够快速上手相关

Langchain-Chatchat是一个基于ChatGLM大语言模型与Langchain应用框架实现,开源、可离线部署的检索增强生成(RAG)大模型的本地知识库问答应用项目。

有人说:“你这客服系统效果咋样?召回率多少?精准率多少?” 我陷入沉思:这测试集得怎么构建呢,怎么能覆盖用户的所有提问……👇来聊聊:在 RAG 智能客服项目中,召回率和精准率到底能不能用,它们评测的是什么,我们又是如何“真正评估”系统效果的?
文章详细解析军事文本数据切片的七种核心策略,包括等长度、自然分段、滑动窗口、语义分割、摘要切片、假设性提问切片和大模型自主语义分割。同时提供文档解析工具库选型指南、复杂格式文档处理策略和切片文档的存储方式,强调高质量数据切片是构建军事智能决策支持系统的基础,直接影响AI在军事场景中的应用效果。
