logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【Node.js包管理02】—— 从npm迁移到pnpm:高效包管理的实战指南

摘要: pnpm是一款高效的前端包管理器,通过硬链接和符号链接技术实现依赖复用,显著节省磁盘空间(多项目可节省70%以上)并提升安装速度(比npm快2-5倍)。其严格依赖管理杜绝“幽灵依赖”,保障项目稳定性。兼容npm/yarn命令,迁移成本低,支持镜像配置和存储路径优化。提供丰富的命令集,涵盖依赖管理、脚本运行、缓存清理等场景,并支持高级功能如并行脚本和缓存管理,适合大型项目与团队协作。Vue/

文章图片
#node.js#npm#前端
【RAG进阶02】—— LlamaIndex — 用数据框架给 LLM 装上“外脑“

LlamaIndex是一个专为LLM设计的框架,旨在解决大语言模型无法直接访问私有数据的问题。它通过RAG(检索增强生成)技术,充当LLM与用户数据之间的桥梁,提供数据连接、索引、检索和生成的一站式解决方案。核心功能包括:1)150+数据连接器支持多种数据源;2)灵活的文档切分和节点管理;3)多种索引类型(向量存储为主);4)可配置的检索策略;5)智能查询引擎;6)支持构建复杂Agent和工作流。

文章图片
#数据库
【RAG进阶04】—— RAG 技术选型 — 传统 RAG、GraphRAG、LlamaIndex、RAGFlow 怎么选?

RAG技术选型指南:四种主流方案对比 本文对比了四种主流RAG技术方案的特点和适用场景: 传统RAG:基础模式,适合快速验证想法,成本低但全局理解能力弱 GraphRAG:微软提出的增强方案,擅长跨文档分析和全局推理,但构建成本高 LlamaIndex:灵活的开发框架,适合需要高度定制的场景,生态丰富 RAGFlow:开箱即用的全栈产品,擅长处理复杂文档格式,适合快速上线 选型建议: 简单问答:传

文章图片
#java#前端#数据库
【大模型微调与部署02】—— ms-swift 自定义数据集完全教程:格式、dataset_info 配置、多格式兼容实战

本文介绍了MS-Swift框架如何配置医疗对话数据集,重点解析了4种支持的数据格式(Messages/ShareGPT/Alpaca/Query-Response)和3种接入方式。针对医疗多轮对话和身份认知数据集,提供了正确的dataset_info.json配置示例,包含字段映射规则和训练命令。特别强调JSON合法性校验、路径规范和格式匹配等常见问题,最后展示了扩展支持的高级格式(RLHF/多模

文章图片
#swift#ssh#开发语言
【大模型微调01】—— LoRA核心参数r和alpha详解:原理+实战+调参指南(MS-Swift适用)

本文基于MS-Swift框架实战,聚焦LoRA微调中最关键的两个参数`lora_rank (r)`和`lora_alpha`,从原理到实战,讲清作用、关系、调参技巧,适配Qwen-1.8B等小模型、医疗等垂直领域场景,看完直接套用。

文章图片
#r语言#swift#开发语言
【大模型微调与部署01】—— ms-swift-3.12入门:安装、快速上手

本文介绍ms-swift 3.12框架,这是一个支持大模型训练、微调、推理、量化和部署的一体化工具。文章详细说明了ms-swift的核心优势,包括支持600+文本模型和300+多模态模型、多种微调方法和显存优化技术。提供了安装指南和快速上手示例,展示如何在单卡3090上10分钟完成Qwen2.5-7B模型的微调。还介绍了训练后的推理测试、模型导出和推送流程。文章最后预告了后续教程内容,包括自定义数

文章图片
#swift#开发语言#ios
【大模型微调与部署03】—— ms-swift-3.12-Megatron-SWIFT命令行参数(训练、推理、对齐、量化、部署全参数)

本文基于 MS-Swift 3.12 官方文档整理,详细介绍了该版本的核心参数及使用规范。内容涵盖基本参数、模型参数、数据参数、模板参数、训练参数和 LoRA 参数六大模块,重点说明 3.12 版本的改进特性与注意事项。文章提供了参数的标准用法和实战示例,适用于 SFT 微调、RLHF 对齐、模型导出等场景,帮助用户避免常见错误并优化训练效果。特别强调 3.12 版本对 Qwen2.5、Llama

文章图片
#swift#ssh#开发语言
【MS-Swift实战】:LoRA原理+核心参数(r/alpha)调参指南(适配Qwen-1.8B医疗场景)

MS-Swift框架LoRA微调实战指南:适配Qwen-1.8B医疗场景 本文深入解析LoRA微调中两个核心参数r(lora_rank)和alpha(lora_alpha)的作用原理与调参技巧。通过通俗比喻解释LoRA仅训练新增小矩阵的特性,重点阐述: r决定模型学习能力,推荐医疗场景使用r=16 alpha控制知识影响力度,通常设为r的2倍 提供三种可直接套用的配置方案:标准版(r=16/alp

文章图片
#swift#r语言#开发语言
【LamaIndex01】—— 用于RAG上下文增强型大语言模型应用程序的框架

在大模型应用开发生态中,LlamaIndex(最新稳定版v0.10.68,2026 年 4 月更新)是专注于私有数据与 LLM 连接的 RAG 专用框架。区别于 LangChain 的 “全栈全能”,它的核心设计哲学是 **“数据优先、检索为王”**—— 所有组件围绕 “文档加载→处理→索引→检索→问答” 的 RAG 全链路构建,智能体编排仅作为附属能力存在。简单来说:LangChain 是 “什

文章图片
#语言模型#人工智能#自然语言处理
【RAG进阶02】—— LlamaIndex — 用数据框架给 LLM 装上“外脑“

LlamaIndex是一个专为LLM设计的框架,旨在解决大语言模型无法直接访问私有数据的问题。它通过RAG(检索增强生成)技术,充当LLM与用户数据之间的桥梁,提供数据连接、索引、检索和生成的一站式解决方案。核心功能包括:1)150+数据连接器支持多种数据源;2)灵活的文档切分和节点管理;3)多种索引类型(向量存储为主);4)可配置的检索策略;5)智能查询引擎;6)支持构建复杂Agent和工作流。

文章图片
#数据库
    共 108 条
  • 1
  • 2
  • 3
  • 11
  • 请选择