weixin_58361918 个人主页

@weixin_58361918

weixin_58361918

2024-05-28 09:37:38 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

Docker容器化与AI大模型部署全栈指南

1. 基础镜像选择 - GPU环境# 2. 元数据标签LABEL description="Qwen2VL模型推理环境"# 3. 环境变量优化# 4. 系统依赖安装（最小化原则）wget \git \curl \# 5. Conda环境安装# 6. 复制环境配置文件并创建环境# 7. 激活环境# 8. 工作目录设置COPY . .# 9. 创建非root用户（安全实践）# 10. 健康检查# 11

#docker #人工智能 #eureka

大模型全栈开发实战指南（第三天）

通过本次实战学习，我们掌握了如何利用和QLoRA技术在有限的算力资源下对开源大模型（如 Qwen）进行微调。核心流程回顾：构造高质量的指令问答对。使用 BitsAndBytesConfig 进行 4-bit 加载。只训练低秩适配器矩阵。使用trl库快速启动训练。加载适配器进行推理。微调不仅让模型学会了特定任务，更重要的是让模型的行为更符合人类的预期，是构建垂直领域 AI 应用的基石技能。

#人工智能

Docker容器化与AI大模型部署全栈指南

#docker #人工智能 #eureka

Vibe Coding的感想：从自动补全到 Copilot 的技术与职业全景

势 = 事物未来发展轨迹的状态行业势整个 AI Coding 行业往哪里走、技术怎么演进、有哪些玩家、典型应用场景是什么。个体势在这样的浪潮下，个人要具备什么能力，如何让自己成为「超级个体」，而不是被时代淘汰。关键思路：先看清「势」，再选择「顺势而为」。

#copilot #学习

Vibe Coding的感想：从自动补全到 Copilot 的技术与职业全景

#copilot #学习

用本地模型创建本地智能体工作坊——构建人生中的第一个 podcast的全流程学习笔记与实践复盘

幕次核心目标关键技术栈输出物第一幕构建单AI代理具备研究、写作、联网能力的智能体第二幕编排多代理工作流Agent Orchestration + DevUI + 工作流引擎完整的播客脚本生成与审批系统第三幕生成多说话人音频VibeVoice TTS + Hugging Face模型真实的播客音频文件（.wav）

#学习

NVIDIA DLI《Build a Deep Research Agent》课程学习笔记

智能体的多阶段工作流由LangGraph等框架编排。# 基于课程描述的智能体工作流伪代码# 第一阶段：Scoping (计划制定)research_plan = scoping_agent.run(user_query) # 与用户对话，生成计划if not user_approves(research_plan): # 人工审批环节# 第二阶段：Execution (计划执行)# 并行检索# 信

数据处理一致性：验证阶段prompt模板需与训练阶段保持一致错误处理：生成时设置可解决"NoneType object has no attribute 'shape'"错误资源管理：训练前后注意显存清理，Demo运行需重启内核释放显存模型选择：源2.0-2B作为中文优化模型，适合中文NLP任务微调LoRA优势：显著减少训练参数，本例中可训练参数占比极小，实现高效微调。

#学习 #人工智能

动手学大模型应用全栈开发学习心得：从零基础到10分钟速通实践baseline

这个教程最大的亮点是将复杂的大模型应用开发流程简化到了极致。通过使用成熟的框架和预训练模型，即使是零基础的学习者也能在短时间内搭建起可用的应用。这让我意识到，学习新技术时，选择合适的工具和框架可以事半功倍。"动手学大模型应用全栈开发"这个教程为我打开了大模型应用开发的大门。通过10分钟的速通实践，我不仅掌握了基本的全栈开发技能，更重要的是建立了继续学习的信心和方向。对于任何想进入大模型应用开发领域

#人工智能

到底了