
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
文章摘要 语义分块(Semantic Chunking)是一种优化RAG系统的文本切分技术,通过分析句子间的向量相似度动态识别语义边界,相比固定长度切块具有显著优势。其核心流程包括:句子分割→向量化→相似度计算→断点检测→输出语义块。断点检测可采用百分位法、标准差法或四分位距法。实现时需考虑计算开销优化,如复用嵌入向量、使用轻量模型等。该技术能保留完整语义单元,提升检索精度和生成答案质量,特别适合

本文基于LlamaIndex框架,结合阿里云DashScope的LLM和嵌入模型,完整演示了RAG系统的搭建流程。主要内容包括:1)环境配置与API密钥设置;2)将OpenAI替换为阿里云DashScope模型;3)混合加载本地文件(PDF/Word等)和网页数据;4)构建向量索引与查询引擎;5)深入解析数据连接器设计与PDF解析原理。文章提供了详细的代码示例,并解释了关键步骤的内部实现机制,帮助
LlamaIndex 的 RAG 工作流解析:从文档处理到智能问答 本文深入剖析了 LlamaIndex 看似简单的四行代码背后完整的 RAG(检索增强生成)工作流程。通过逐行拆解,揭示了从文档解析、文本分块、向量化、索引构建到最终答案生成的完整技术链路。文章详细说明了每个步骤的底层实现原理,包括默认参数配置、数据处理方式和系统组件交互。同时提供了常见问题的优化建议,如调整分块大小、修改检索数量等
LlamaIndex 是一个流行的 RAG(检索增强生成)框架,提供四大核心模块构建生产级应用: 数据连接器:支持从本地文件、数据库、Web等20+数据源加载数据,提供PDF解析等高级功能 数据索引:将文档转换为可检索的向量索引,支持多种文本切分策略和向量数据库 查询引擎:实现智能检索与生成,包含查询路由、重写和规划等高级功能 数据代理:支持多工具协同和复杂任务分解 框架提供模块化设计,开发者可灵
本文详细解析了Transformer模型的三个核心模块:多头注意力(MultiHeadAttention)、前馈网络(FFN)和词嵌入(Embedding)。多头注意力通过将输入拆分为多个头并行计算注意力,实现复杂度为O(B×T²×D);FFN采用两层线性变换加ReLU激活的结构,增强模型表达能力;词嵌入将离散符号映射为连续向量。文章提供了Python(PyTorch)和C++(LibTorch)
本文深入解析了大语言模型训练前的三个核心预处理组件:BPE分词、嵌入层和位置编码。BPE分词通过合并高频字符对构建子词词表,平衡了词表大小和序列长度;嵌入层将离散ID映射为连续向量,并引入缩放因子稳定梯度;位置编码为序列注入位置信息以弥补自注意力机制的无序性。文章详细讲解了各组件原理,提供了完整的代码实现和复杂度分析,并通过测试用例展示了实际应用效果。理解这三个组件是掌握Transformer模型

本文详细讲解了Transformer的两大核心模块:多头注意力(Multi-Head Attention)和层归一化(Layer Normalization)的实现原理与PyTorch代码。多头注意力通过拆分特征维度为多个头并行计算注意力,增强模型表达能力;层归一化则对特征维度进行标准化,稳定训练过程。文章包含完整的代码实现、形状变化图解、复杂度分析以及测试示例,帮助读者深入理解现代大模型的底层机
这篇文章全面介绍了提示词工程的关键技术,主要包含三部分内容: API参数详解:重点讲解了max_tokens、temperature、top_k/p等核心参数的作用和设置技巧,通过代码示例展示如何控制输出长度、随机性和重复性。 结构化输出:详细介绍了JSON和JSON Schema两种结构化输出方法,强调JSON Schema在格式约束上的优势,并提供了具体实现代码。 提示词设计技巧:系统阐述了指
DeepSeek-V3是一款基于混合专家(MoE)架构的通用大语言模型,参数规模达6710亿,但每个Token仅激活370亿参数,显著提升推理效率。模型采用两阶段训练:预训练阶段使用14.8T多样化token数据,重点强化数学和编程能力,并通过两阶段策略将上下文长度扩展到128K;后训练阶段通过150万指令数据集进行有监督微调,并结合强化学习优化推理能力。关键技术包括:多头潜在注意力(MLA)降低

摘要 通用模型和推理模型在功能定位、数据训练、结构规模和应用场景上存在显著差异。通用模型(如GPT-3)具有广泛的知识覆盖和泛化能力,适合多样化任务;而推理模型(如DeepSeek-R1)专注于特定领域的逻辑分析,强调精确推理能力。DeepSeek-R1采用强化学习优化架构,通过思维链(CoT)技术实现复杂问题的分步求解,并创新性地结合无监督学习提升推理能力。知识蒸馏技术则可将大模型的推理能力迁移








