logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

思维导图笔记:模型微调技术

模型微调技术 思维导图(定稿版) 总览 微调基础与选型 微调数据准备 微调过程与参数配置 微调评估与效果验证 微调部署与工程化 一、微调基础与选型 什么时候需要微调(选型决策) 先问自己:RAG或Prompt能不能解决? 能用Prompt解决 → 别微调(成本最低)能用RAG解决 → 别微调(知识更新灵活)两者都搞不定 → 考虑微调 必须微调的典型场景 需要模型学会特定的输出格式或风格(Promp

思维导图笔记:大模型幻觉问题

大模型幻觉问题 思维导图(定稿版) 总览 幻觉产生的原因 幻觉检测方法 幻觉缓解策略(生成前/生成中) 幻觉缓解策略(生成后) 评估与评测体系 一、幻觉产生的原因 数据层面 训练数据本身包含错误信息 举例:互联网爬取的文本里存在过时知识、谣言、偏见,模型学了就输出 数据覆盖不足 长尾知识、小众领域、最新事件在训练数据中占比极低,模型只能猜 面试点:模型不是故意编造,而是训练时就学到了错误的知识 训

LLM成长笔记(九):模型微调与定制

从 SFT/DPO 的选型决策,到 LoRA 的低秩分解和 QLoRA 的显存优化,再到微调后的科学评估,你已掌握模型定制化的核心技术栈。面试中的高频考点——SFT vs DPO 的适用场景、LoRA 的参数量计算、QLoRA 的显存推导——都已覆盖。现在你可以用消费级显卡,把通用大模型打造成专属领域的专家了。

LLM成长笔记(十三):系统设计与项目实战

从画出完整 RAG 系统架构图并解释每个组件选型,到消息队列异步化、熔断降级的高可用设计,再到多租户数据隔离、PII 脱敏和数据飞轮构建,你已掌握 AI 系统设计的核心能力。面试中的高频考点——架构图绘制与选型理由、高可用设计手段、数据安全与合规、持续迭代闭环——都已覆盖。现在你可以自信地应对任何 AI 应用开发的系统设计面试了。

#unity#游戏引擎
LLM成长笔记(十二):质量评估与可观测性

从 LLM-as-a-Judge 的自动评分和 RAGAS 框架的专项评估,到 Langfuse 链路追踪的可观测性,再到缓存策略和降级兜底的成本控制,最后到三层防御和红队测试的内容安全,你已掌握 AI 应用上线后的质量保障体系。面试中的高频考点——LLM-as-a-Judge 的评分方法与偏差缓解、链路追踪的 Trace/Span 定位、成本控制的三层策略、内容安全的三层防御——都已覆盖。现在你

#人工智能#大数据
LLM成长笔记(十一):模型部署与工程化

从 Ollama 本地一键部署,到 Docker 容器化和 docker-compose 编排,再到 vLLM 高性能推理的连续批处理和 PagedAttention 原理,模型量化的显存优化,以及生产环境的冷启动、蓝绿部署、并发控制,你已掌握模型工程化的完整技能栈。面试中的高频考点——Ollama 部署、vLLM 优化原理、显存计算、docker-compose 编排——都已覆盖。现在你可以把训

LLM成长笔记(十一):模型部署与工程化

从 Ollama 本地一键部署,到 Docker 容器化和 docker-compose 编排,再到 vLLM 高性能推理的连续批处理和 PagedAttention 原理,模型量化的显存优化,以及生产环境的冷启动、蓝绿部署、并发控制,你已掌握模型工程化的完整技能栈。面试中的高频考点——Ollama 部署、vLLM 优化原理、显存计算、docker-compose 编排——都已覆盖。现在你可以把训

LLM成长笔记(十):多模态应用开发

从调用 GPT-4o 看懂图片、Whisper 听懂语音,到用 CLIP 构建图文检索的多模态 RAG 完整闭环,再到实时音视频 AI 管线的工程要点,你已掌握多模态应用开发的核心技能。面试中的高频考点——CLIP 的对比学习原理、多模态 RAG 的检索+生成流程、实时管线的 VAD 和时间戳对齐——都已覆盖。现在你可以打造能看、能听、能搜索的多模态 AI 应用了。

#语音识别#人工智能
LLM成长笔记(九):模型微调与定制

从 SFT/DPO 的选型决策,到 LoRA 的低秩分解和 QLoRA 的显存优化,再到微调后的科学评估,你已掌握模型定制化的核心技术栈。面试中的高频考点——SFT vs DPO 的适用场景、LoRA 的参数量计算、QLoRA 的显存推导——都已覆盖。现在你可以用消费级显卡,把通用大模型打造成专属领域的专家了。

LLM成长笔记(七): AI 应用框架与编排

问题简单 Chain 只能串行执行,如何实现更复杂的流程——比如并行调用多个模型、条件分支、流式输出?生活化类比LCEL 就像乐高积木的接口规范——所有积木(组件)都遵循统一的插拔标准,你可以把检索器、模型、解析器像积木一样任意拼接。术语详解:用管道符串联组件,声明式定义执行流程。:并行执行多个分支。:条件分支,根据输入动态选择执行路径。回调(Callback):在 Chain 执行过程中插入钩子

#人工智能#前端
    共 22 条
  • 1
  • 2
  • 3
  • 请选择