
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
本文系统阐述了大语言模型(LLM)从基础模型到AI助手的后训练流程,重点解析了SFT、DPO和GRPO三阶段技术。SFT通过指令-回答样本训练模型遵循指令;DPO利用偏好对优化回答质量;GRPO通过强化学习提升推理能力。文章对比了不同训练方法的优劣,强调数据集质量的重要性,并指出RL阶段虽能显著提升性能但需较高算力支持。后训练技术经历了从SFT到DPO再到RL的演进,当前开源工具已使完整流程对开发

本文系统阐述了2025-2026年生产级AI系统的完整技术栈。文章按数据层→训练层→推理层→智能体层的递进顺序,深入解析了构建高性能AI系统的核心原理与工程实践。重点包括:Parquet/Arrow数据管道优化、GPU训练加速技术(DALI/ZeRO/FSDP)、大模型微调方法(LoRA/DPO)、vLLM推理优化,以及新兴的智能体MLOps架构(MCP协议)。特别强调现代AI性能瓶颈已从算法转向

工业级AI技能开发的核心在于模块化与工程化,而非堆砌提示词。关键开发流程包括:1)评估先行,建立覆盖正例、负例和边界用例的测试集;2)精准定义触发条件而非功能描述;3)聚焦特殊规则而非基础流程;4)采用分层文件结构实现渐进式加载。开发中需遵循五大原则:评估驱动、边界优先、最小上下文、容错设计和持续迭代。常见误区包括混淆技能与提示词、忽视评估测试、过度详细步骤说明等,这些都会影响技能的稳定性和扩展性
工业级AI技能开发的核心在于模块化与工程化,而非堆砌提示词。关键开发流程包括:1)评估先行,建立覆盖正例、负例和边界用例的测试集;2)精准定义触发条件而非功能描述;3)聚焦特殊规则而非基础流程;4)采用分层文件结构实现渐进式加载。开发中需遵循五大原则:评估驱动、边界优先、最小上下文、容错设计和持续迭代。常见误区包括混淆技能与提示词、忽视评估测试、过度详细步骤说明等,这些都会影响技能的稳定性和扩展性
压缩的核心逻辑是“完整保留最近核心对话,对早期对话生成高信息密度摘要”,类似开卷考试中“完整保留最新考点,对往期内容做精炼总结”。触发模式:支持手动触发(用户通过/compact命令执行,可指定保留内容)与自动触发(系统实时监控token用量,当用量超过上下文窗口-预留缓冲的水位线时自动执行,例如20万窗口在用量超过18万时触发);技术实现:采用自适应分块策略,基于token比例动态调整分块大小(

本文详细介绍了使用PyTorch构建高效图像数据加载流水线的方法。主要内容包括:1) 通过Dataset和DataLoader实现数据批量加载;2) 使用ImageFolder处理自定义分类数据集;3) 应用transforms模块进行数据预处理和增强;4) 内置数据集(MNIST)的快速使用方法。教程以花卉分类为例,完整演示了从数据集划分、预处理到可视化展示的全流程,为深度学习模型训练提供了标准
摘要:Milvus是一款开源向量数据库,专为处理AI时代的非结构化数据(文本、图像等)而设计。它支持三种部署模式(Lite/Standalone/Distributed),采用计算与存储分离的云原生架构。核心功能包括:1)高效向量检索,支持十亿级数据毫秒响应;2)混合搜索能力,结合向量相似性、标量过滤和全文检索;3)丰富的索引类型(HNSW/IVF/DISKANN等)。通过Schema定义数据模型

本文系统阐述了2025-2026年生产级AI系统的完整技术栈。文章按数据层→训练层→推理层→智能体层的递进顺序,深入解析了构建高性能AI系统的核心原理与工程实践。重点包括:Parquet/Arrow数据管道优化、GPU训练加速技术(DALI/ZeRO/FSDP)、大模型微调方法(LoRA/DPO)、vLLM推理优化,以及新兴的智能体MLOps架构(MCP协议)。特别强调现代AI性能瓶颈已从算法转向

本文系统阐述了2025-2026年生产级AI系统的完整技术栈。文章按数据层→训练层→推理层→智能体层的递进顺序,深入解析了构建高性能AI系统的核心原理与工程实践。重点包括:Parquet/Arrow数据管道优化、GPU训练加速技术(DALI/ZeRO/FSDP)、大模型微调方法(LoRA/DPO)、vLLM推理优化,以及新兴的智能体MLOps架构(MCP协议)。特别强调现代AI性能瓶颈已从算法转向

本文系统阐述了大语言模型(LLM)从基础模型到AI助手的后训练流程,重点解析了SFT、DPO和GRPO三阶段技术。SFT通过指令-回答样本训练模型遵循指令;DPO利用偏好对优化回答质量;GRPO通过强化学习提升推理能力。文章对比了不同训练方法的优劣,强调数据集质量的重要性,并指出RL阶段虽能显著提升性能但需较高算力支持。后训练技术经历了从SFT到DPO再到RL的演进,当前开源工具已使完整流程对开发









