logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【收藏必学】RAG系统架构全解析:从原理到实战,小白也能掌握的大模型增强技术

RAG(检索增强生成)系统结合信息检索与大语言模型生成能力,通过文档准备和问答处理两个阶段,将私有文档知识与大模型推理能力相结合,解决大模型知识滞后、幻觉等问题。文章详细介绍了RAG系统的工作流程,包括向量化转换、多路检索策略、重排序评分等环节,并针对文档处理、分块策略、向量数据库选型等常见问题提供了解决方案,帮助开发者构建高效的企业级知识库系统。

文章图片
#人工智能#RAG
【收藏必学】RAG系统架构全解析:从原理到实战,小白也能掌握的大模型增强技术

RAG(检索增强生成)系统结合信息检索与大语言模型生成能力,通过文档准备和问答处理两个阶段,将私有文档知识与大模型推理能力相结合,解决大模型知识滞后、幻觉等问题。文章详细介绍了RAG系统的工作流程,包括向量化转换、多路检索策略、重排序评分等环节,并针对文档处理、分块策略、向量数据库选型等常见问题提供了解决方案,帮助开发者构建高效的企业级知识库系统。

文章图片
#人工智能#RAG
【收藏必备】一文读懂多模态:从入门到实践的大模型技术指南

本文系统介绍多模态概念及其在深度学习中的应用,详解模态表示、对齐和融合三大关键技术,涵盖显式/隐式对齐策略和数据级/特征级/目标级融合方法。同时梳理了多模态在视听识别、情感计算、跨媒体检索、图像描述等领域的任务应用,为小白和程序员提供全面的多模态学习路径。

文章图片
#人工智能
【收藏必备】一文读懂多模态:从入门到实践的大模型技术指南

本文系统介绍多模态概念及其在深度学习中的应用,详解模态表示、对齐和融合三大关键技术,涵盖显式/隐式对齐策略和数据级/特征级/目标级融合方法。同时梳理了多模态在视听识别、情感计算、跨媒体检索、图像描述等领域的任务应用,为小白和程序员提供全面的多模态学习路径。

文章图片
#人工智能
【必藏干货】零基础掌握Embedding模型微调,LlamaIndex让RAG效果大幅提升

本文详细介绍了使用LlamaIndex微调Embedding模型的方法,针对RAG系统检索效果不佳的问题。通过三步走策略:自动生成训练数据集、使用SentenceTransformersFinetuneEngine进行模型微调、以及使用命中率指标评估效果。实战表明,微调后的模型在专业领域的检索命中率从8.9%提升到23.5%,显著提升了RAG系统的检索准确率。该方法无需人工标注,代码简洁,易于实现

文章图片
#人工智能#RAG
AI必学:先embedding再chunking:Max-Min语义分块技术,让RAG更精准(建议收藏)

文章介绍了RAG应用开发中从传统"先chunking再embedding"向"先embedding再chunking"转变的新趋势,重点解读了Max-Min semantic chunking方法。该方法通过动态语义评估实现分块优化,将分块视为时序聚类问题,只需3个核心超参数且计算资源复用,能更好地平衡精度与上下文。虽然处理长文档时可能丢失长距离上下文依赖关系,但可通过滑动窗口等方式解决,是提升R

文章图片
#人工智能
收藏!大模型训练秘籍:Tokenizer详解到小型LLM预练全流程

文章详细介绍了大语言模型的训练流程,重点讲解了Tokenizer的三种分词方法及BPE等算法实现。提供了从数据预处理、模型训练到微调,使用Seq-Monkey和BelleGroup数据集训练8000万参数中文大模型。通过PretrainDataset和SFTDataset两种数据集格式,实现了模型从语言学习到对话能力的训练过程,最后展示了模型文本生成方法。

文章图片
#人工智能
收藏!大模型训练秘籍:Tokenizer详解到小型LLM预练全流程

文章详细介绍了大语言模型的训练流程,重点讲解了Tokenizer的三种分词方法及BPE等算法实现。提供了从数据预处理、模型训练到微调,使用Seq-Monkey和BelleGroup数据集训练8000万参数中文大模型。通过PretrainDataset和SFTDataset两种数据集格式,实现了模型从语言学习到对话能力的训练过程,最后展示了模型文本生成方法。

文章图片
#人工智能
收藏必备:让小模型媲美GPT-4:ACE智能体上下文工程框架深度解析

ACE框架是斯坦福与SambaNova联合提出的智能体上下文工程方案,通过生成器、反思器和整理器三大组件,将静态提示词升级为动态演化的操作手册。它解决了智能体开发中的简洁性偏差和上下文坍缩两大痛点,通过增量delta更新和增长-优化机制,使开源小模型也能媲美顶级工业级智能体,在任务完成率上甚至超出8.4%,同时大幅降低部署成本和适配延迟。

文章图片
#人工智能#AI智能体
收藏必备:让小模型媲美GPT-4:ACE智能体上下文工程框架深度解析

ACE框架是斯坦福与SambaNova联合提出的智能体上下文工程方案,通过生成器、反思器和整理器三大组件,将静态提示词升级为动态演化的操作手册。它解决了智能体开发中的简洁性偏差和上下文坍缩两大痛点,通过增量delta更新和增长-优化机制,使开源小模型也能媲美顶级工业级智能体,在任务完成率上甚至超出8.4%,同时大幅降低部署成本和适配延迟。

文章图片
#人工智能#AI智能体
    共 1071 条
  • 1
  • 2
  • 3
  • 108
  • 请选择