logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

RAG优化系列:语义分块(Semantic Chunking)详解与实战

文章摘要 语义分块(Semantic Chunking)是一种优化RAG系统的文本切分技术,通过分析句子间的向量相似度动态识别语义边界,相比固定长度切块具有显著优势。其核心流程包括:句子分割→向量化→相似度计算→断点检测→输出语义块。断点检测可采用百分位法、标准差法或四分位距法。实现时需考虑计算开销优化,如复用嵌入向量、使用轻量模型等。该技术能保留完整语义单元,提升检索精度和生成答案质量,特别适合

文章图片
#自然语言处理#人工智能
LlamaIndex 实战:从数据连接到 RAG 问答(阿里云 DashScope + 混合加载)

本文基于LlamaIndex框架,结合阿里云DashScope的LLM和嵌入模型,完整演示了RAG系统的搭建流程。主要内容包括:1)环境配置与API密钥设置;2)将OpenAI替换为阿里云DashScope模型;3)混合加载本地文件(PDF/Word等)和网页数据;4)构建向量索引与查询引擎;5)深入解析数据连接器设计与PDF解析原理。文章提供了详细的代码示例,并解释了关键步骤的内部实现机制,帮助

#阿里云#云计算
# 【学习记录】LlamaIndex 四行代码背后的完整 RAG 工作流:从文档解析到生成答案 > 很多人第一次接触 LlamaIndex 时,会被它的简洁 API 震撼——短短三四行代码就能搭建一

LlamaIndex 的 RAG 工作流解析:从文档处理到智能问答 本文深入剖析了 LlamaIndex 看似简单的四行代码背后完整的 RAG(检索增强生成)工作流程。通过逐行拆解,揭示了从文档解析、文本分块、向量化、索引构建到最终答案生成的完整技术链路。文章详细说明了每个步骤的底层实现原理,包括默认参数配置、数据处理方式和系统组件交互。同时提供了常见问题的优化建议,如调整分块大小、修改检索数量等

#学习#服务器#python
LlamaIndex 核心模块详解:从数据连接到智能代理,构建生产级 RAG 系统

LlamaIndex 是一个流行的 RAG(检索增强生成)框架,提供四大核心模块构建生产级应用: 数据连接器:支持从本地文件、数据库、Web等20+数据源加载数据,提供PDF解析等高级功能 数据索引:将文档转换为可检索的向量索引,支持多种文本切分策略和向量数据库 查询引擎:实现智能检索与生成,包含查询路由、重写和规划等高级功能 数据代理:支持多工具协同和复杂任务分解 框架提供模块化设计,开发者可灵

#jvm#python
Transformer 核心模块详解:多头注意力、前馈网络与词嵌入

本文详细解析了Transformer模型的三个核心模块:多头注意力(MultiHeadAttention)、前馈网络(FFN)和词嵌入(Embedding)。多头注意力通过将输入拆分为多个头并行计算注意力,实现复杂度为O(B×T²×D);FFN采用两层线性变换加ReLU激活的结构,增强模型表达能力;词嵌入将离散符号映射为连续向量。文章提供了Python(PyTorch)和C++(LibTorch)

#transformer#深度学习#人工智能
从 BPE 分词到位置编码:大模型预处理三组件完全解析

本文深入解析了大语言模型训练前的三个核心预处理组件:BPE分词、嵌入层和位置编码。BPE分词通过合并高频字符对构建子词词表,平衡了词表大小和序列长度;嵌入层将离散ID映射为连续向量,并引入缩放因子稳定梯度;位置编码为序列注入位置信息以弥补自注意力机制的无序性。文章详细讲解了各组件原理,提供了完整的代码实现和复杂度分析,并通过测试用例展示了实际应用效果。理解这三个组件是掌握Transformer模型

文章图片
#python
手撕 Transformer 核心组件:多头注意力 + 层归一化(PyTorch 逐行详解)

本文详细讲解了Transformer的两大核心模块:多头注意力(Multi-Head Attention)和层归一化(Layer Normalization)的实现原理与PyTorch代码。多头注意力通过拆分特征维度为多个头并行计算注意力,增强模型表达能力;层归一化则对特征维度进行标准化,稳定训练过程。文章包含完整的代码实现、形状变化图解、复杂度分析以及测试示例,帮助读者深入理解现代大模型的底层机

#transformer#pytorch#深度学习
提示词工程完全指南:从API参数到结构化输出,像调音师一样控制大模型

这篇文章全面介绍了提示词工程的关键技术,主要包含三部分内容: API参数详解:重点讲解了max_tokens、temperature、top_k/p等核心参数的作用和设置技巧,通过代码示例展示如何控制输出长度、随机性和重复性。 结构化输出:详细介绍了JSON和JSON Schema两种结构化输出方法,强调JSON Schema在格式约束上的优势,并提供了具体实现代码。 提示词设计技巧:系统阐述了指

DeepSeek-V3介绍

DeepSeek-V3是一款基于混合专家(MoE)架构的通用大语言模型,参数规模达6710亿,但每个Token仅激活370亿参数,显著提升推理效率。模型采用两阶段训练:预训练阶段使用14.8T多样化token数据,重点强化数学和编程能力,并通过两阶段策略将上下文长度扩展到128K;后训练阶段通过150万指令数据集进行有监督微调,并结合强化学习优化推理能力。关键技术包括:多头潜在注意力(MLA)降低

文章图片
#学习
DeepSeek-R1介绍

摘要 通用模型和推理模型在功能定位、数据训练、结构规模和应用场景上存在显著差异。通用模型(如GPT-3)具有广泛的知识覆盖和泛化能力,适合多样化任务;而推理模型(如DeepSeek-R1)专注于特定领域的逻辑分析,强调精确推理能力。DeepSeek-R1采用强化学习优化架构,通过思维链(CoT)技术实现复杂问题的分步求解,并创新性地结合无监督学习提升推理能力。知识蒸馏技术则可将大模型的推理能力迁移

文章图片
#学习
    共 66 条
  • 1
  • 2
  • 3
  • 7
  • 请选择