玄米乌龙茶123 个人主页

@2301_78074860

玄米乌龙茶123

2025-07-24 18:08:19 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

LLM成长笔记（一）：Python 核心知识点

这篇博客用“问题-类比-原理-演示”的四步法，并针对 AI 应用开发补充了进阶操作和实战提示。从基本的getbreaksuper()、多重异常，到文件 I/O 的二进制与结构化读写，再到生成器表达式、、mypy 静态检查——你现在不仅掌握了 Python 核心语法，还理解了它们在真实 AI 开发中的位置。亲手运行每一段代码，把这些基础刻进肌肉记忆里，它们会成为你构建更复杂系统的坚实基石。

#人工智能

Python 进阶核心概念：AI 应用开发岗面试突击指南

AI 应用开发初级岗位中，Python 进阶的考察重点不是死记硬背，而是能清晰说出每种机制在真实 AI 场景下的应用方式与优劣，并能写出健壮、可读的代码。掌握以上五大模块的原理、伪代码和面试题回答思路，足以帮你从容应对相关技术面。

#人工智能 #python #面试

学习笔记--人脸识别模型训练（face_recognition库）

本文为的后续内容，使用树莓派实现人脸识别项目的子内容。由于人脸识别项目的运行环境是树莓派4b，内存资源相对有限，因此选择face_recognition库作为人脸识别的模型。

#学习

LLM 应用开发学习笔记：RAG 评估、参数调优与 Transformer 注意力机制

这是孔子角色扮演问答系统开发笔记的一部分。在完成 Embedding、向量检索、分块和数据库选型后，我们把焦点转向更核心的问题：如何科学地评价检索系统好不好？调参有什么可复用的经验？以及，Transformer 究竟是怎么“读懂”一句话的？项目背景：基于 DeepSeek 大模型的孔子对话应用，后端用 BGE 嵌入 + ChromaDB 检索论语章句。

#学习

LLM成长笔记（十）：多模态应用开发

从调用 GPT-4o 看懂图片、Whisper 听懂语音，到用 CLIP 构建图文检索的多模态 RAG 完整闭环，再到实时音视频 AI 管线的工程要点，你已掌握多模态应用开发的核心技能。面试中的高频考点——CLIP 的对比学习原理、多模态 RAG 的检索+生成流程、实时管线的 VAD 和时间戳对齐——都已覆盖。现在你可以打造能看、能听、能搜索的多模态 AI 应用了。

#语音识别 #人工智能

LLM成长笔记（十一）：模型部署与工程化

从 Ollama 本地一键部署，到 Docker 容器化和 docker-compose 编排，再到 vLLM 高性能推理的连续批处理和 PagedAttention 原理，模型量化的显存优化，以及生产环境的冷启动、蓝绿部署、并发控制，你已掌握模型工程化的完整技能栈。面试中的高频考点——Ollama 部署、vLLM 优化原理、显存计算、docker-compose 编排——都已覆盖。现在你可以把训

LLM成长笔记（五）：提示词工程与模型调用

从写好一个提示词的基本功，到思维链、模板化、DSPy 自动化优化，再到安全防护，你已经掌握了提示工程的核心技术栈。每个概念都配有生活化类比和可运行代码，新术语也在第一时间被详细解释。现在你可以把这些方法应用到实际项目中，让大模型真正成为你的得力助手，同时守住安全底线。

#人工智能

思维导图笔记：LangChain/LlamaIndex等框架应用

LangChain/LlamaIndex等框架应用思维导图（定稿版）总览框架定位与对比 LangChain核心体系 LlamaIndex核心体系框架工程化与选型一、框架定位与对比 LangChain定位一句话定位：通用LLM应用开发框架，像“瑞士军刀” 提供了构建LLM应用所需的各种组件和抽象核心能力 Chain（链）：把多个步骤串起来，A→B→CAgent（智能体）：让LLM自主决

#python

LLM成长笔记（四）：大语言模型（LLM）基础认知

从 Transformer 的自注意力机制、文本到向量的转换流程，到解码策略的温度/采样控制，你已建立对 LLM 内部工作的深层理解。中级篇用对比和图标帮你选型，并教会你阅读模型卡、理解许可证和估算成本。每个概念都配有可操作代码和直观图解，现在你可以自信地进入大语言模型的世界，开始自己的探索与实践了。

#语言模型 #人工智能

孔夫子 AI 聊天助手：模拟面试笔记

滑动窗口：最近 5 轮（10 条消息）完整保留原文。为什么不直接截断？超过 5 轮就丢 → 用户感觉"助手失忆了"。增量摘要第 1-5 轮 → 原文保留第 6 轮 → 第1轮溢出 → LLM 生成摘要 S1第 7 轮 → 取 S1 + 第2轮 → 合并成 S2第 N 轮 → 只取"新增溢出"(2条) + 旧摘要 → LLM 合并增量而非每次重跑全部溢出：省 token、更快。注入[前情提要]sys

#人工智能 #面试

共 34 条

请选择