malog_ 个人主页

@2403_89428850

malog_

2025-03-26 20:59:13 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

LLM驱动Grep的代码搜索架构

本文基于2026年3月泄露的Claude Code CLI源码快照，深入拆解了Anthropic放弃RAG、改用。

#架构 #全文检索

生成式AI时代：基础设施决定模型性能上限

本文系统阐述了2025-2026年生产级AI系统的完整技术栈。文章按数据层→训练层→推理层→智能体层的递进顺序，深入解析了构建高性能AI系统的核心原理与工程实践。重点包括：Parquet/Arrow数据管道优化、GPU训练加速技术（DALI/ZeRO/FSDP）、大模型微调方法（LoRA/DPO）、vLLM推理优化，以及新兴的智能体MLOps架构（MCP协议）。特别强调现代AI性能瓶颈已从算法转向

#人工智能

大语言模型后训练全解析

本文系统阐述了大语言模型（LLM）从基础模型到AI助手的后训练流程，重点解析了SFT、DPO和GRPO三阶段技术。SFT通过指令-回答样本训练模型遵循指令；DPO利用偏好对优化回答质量；GRPO通过强化学习提升推理能力。文章对比了不同训练方法的优劣，强调数据集质量的重要性，并指出RL阶段虽能显著提升性能但需较高算力支持。后训练技术经历了从SFT到DPO再到RL的演进，当前开源工具已使完整流程对开发

#人工智能 #机器学习 #深度学习 +1

工业级Skill开发：5步避坑指南

工业级AI技能开发的核心在于模块化与工程化，而非堆砌提示词。关键开发流程包括：1）评估先行，建立覆盖正例、负例和边界用例的测试集；2）精准定义触发条件而非功能描述；3）聚焦特殊规则而非基础流程；4）采用分层文件结构实现渐进式加载。开发中需遵循五大原则：评估驱动、边界优先、最小上下文、容错设计和持续迭代。常见误区包括混淆技能与提示词、忽视评估测试、过度详细步骤说明等，这些都会影响技能的稳定性和扩展性

压缩的核心逻辑是“完整保留最近核心对话，对早期对话生成高信息密度摘要”，类似开卷考试中“完整保留最新考点，对往期内容做精炼总结”。触发模式：支持手动触发（用户通过/compact命令执行，可指定保留内容）与自动触发（系统实时监控token用量，当用量超过上下文窗口-预留缓冲的水位线时自动执行，例如20万窗口在用量超过18万时触发）；技术实现：采用自适应分块策略，基于token比例动态调整分块大小（

#大数据 #人工智能

PyTorch图像数据加载实战指南

本文详细介绍了使用PyTorch构建高效图像数据加载流水线的方法。主要内容包括：1) 通过Dataset和DataLoader实现数据批量加载；2) 使用ImageFolder处理自定义分类数据集；3) 应用transforms模块进行数据预处理和增强；4) 内置数据集(MNIST)的快速使用方法。教程以花卉分类为例，完整演示了从数据集划分、预处理到可视化展示的全流程，为深度学习模型训练提供了标准

#pytorch #人工智能 #python +1

Milvus向量数据库：AI时代的搜索革命

摘要：Milvus是一款开源向量数据库，专为处理AI时代的非结构化数据（文本、图像等）而设计。它支持三种部署模式（Lite/Standalone/Distributed），采用计算与存储分离的云原生架构。核心功能包括：1）高效向量检索，支持十亿级数据毫秒响应；2）混合搜索能力，结合向量相似性、标量过滤和全文检索；3）丰富的索引类型（HNSW/IVF/DISKANN等）。通过Schema定义数据模型

#milvus #数据库 #人工智能 +1

共 30 条

请选择