m0_74044215 个人主页

@m0_74044215

m0_74044215

2025-07-29 09:49:44 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

深度解析：PE与RoPE位置编码技术对比

摘要：本文深入解析Transformer模型中的两种主流位置编码技术：正弦位置编码(PE)和旋转位置编码(RoPE)。PE通过固定向量与词嵌入相加注入绝对位置信息，但外推性较差；RoPE则通过矩阵旋转将相对位置信息融入Attention机制的Q、K向量，具有优异的长度外推能力。文章对比了两者的数学原理、作用位置及优缺点，指出RoPE因其相对位置编码机制和出色的外推性，已成为Llama等现代大模型的

#深度学习 #自然语言处理 #pytorch +1

Prompt、MCP、Agent：智能LLM应用三大核心

摘要：大型语言模型（LLM）的智能应用构建依赖于三大核心技术：Prompt（提示）作为基础交互接口，指导模型生成特定输出；MCP（元认知提示）通过自我反思和任务分解，提升LLM的推理与修正能力；Agent（智能体）整合LLM、记忆模块和工具，实现自主规划与任务执行。三者形成递进关系：Prompt是初始指令，MCP优化Agent的决策逻辑，Agent最终落地为可执行的智能系统。这一协作体系推动LL

#人工智能 #RAG #MCP

TF-IDF vs BM25：搜索算法终极对比

本文对比了文本检索中的TF-IDF和BM25算法。TF-IDF通过词频和逆文档频率计算相关性，但存在词频无限增长和长文档偏见问题。BM25作为改进版，引入k1（控制词频饱和度）和b（文档长度归一化）参数，使评分更合理。核心差异体现在：BM25对高频词进行渐进式惩罚，动态调整文档长度影响，且参数可调性更强。实际应用中，BM25已成为工业标准（如Elasticsearch），特别适合搜索引擎和RAG系

#人工智能

意图识别：从BERT到LLM的进化之路

本文系统梳理了意图识别技术的发展脉络，从早期的规则匹配、机器学习方法到深度学习和LLM时代的变革。意图识别作为对话系统的核心环节，其技术演进经历了三个阶段：基于规则的简单匹配、基于统计的机器学习分类，以及利用BERT等预训练模型的深度学习。文章通过PyTorch代码示例展示了BERT模型的实践应用，并重点分析了LLM时代Prompt Engineering和Function Calling带来的范

深入解析KVCache：大模型推理加速利器

摘要： KVCache（Key-Value Cache）是大语言模型（LLM）推理加速的关键技术，通过缓存历史token的Key和Value向量，避免重复计算自注意力，显著降低计算复杂度（从O(L²)到O(L)）。其核心原理是在自回归生成时复用缓存的K/V向量，仅计算当前token的新向量。虽然KVCache大幅提升推理速度，但会占用显存（与模型层数、头数、序列长度成正比）。优化方案包括多查询注意

#深度学习 #自然语言处理 #人工智能

现代检索三剑客：Milvus、ES与MongoDB的完美协同

现代检索架构三剑客：Milvus、Elasticsearch与MongoDB的分工协作在构建智能检索系统时，三种专业数据库各司其职： Milvus专攻向量检索，通过ANN算法实现高维向量的相似性搜索，适用于AI语义召回； Elasticsearch擅长全文检索，基于倒排索引支持关键词匹配和复杂过滤； MongoDB作为文档存储，负责原始数据的持久化管理。三者协同可构建强大混合检索系统：Milv

#数据库

大模型高并发实战：计算与优化全解析

摘要：大型语言模型（LLMs）在生产环境面临高并发和高吞吐量挑战。本文探讨了量化计算资源需求的方法，包括显存估算（模型参数+KVCache）和吞吐量预测（TTFT/TPOT）。重点介绍了三大优化策略：动态批处理消除计算浪费，PagedAttention管理KVCache提升并发能力，以及量化技术减少显存占用。这些工程实践能显著提升GPU利用率，帮助构建高效的LLM推理服务。通过精确容量规划和系统优

#大数据 #人工智能 #算法

Prompt、MCP、Agent：智能LLM应用三大核心

#人工智能 #RAG #MCP

关系型与非关系型数据库终极对决

关系型数据库（RDB）与非关系型数据库（NoSQL）是现代数据存储的两大核心选择。RDB以严格的表结构和ACID事务为特点，适合金融系统等高一致性场景；NoSQL则提供灵活的数据模型和水平扩展能力，适用于高并发、大数据和AI应用。典型RDB包括MySQL、PostgreSQL，而NoSQL涵盖MongoDB、Redis等多种类型。实际应用中常采用多模型持久化策略，根据业务需求组合使用不同数据库。理

#数据库 #人工智能

现代检索三剑客：Milvus、ES与MongoDB的完美协同

#数据库

共 14 条

请选择