logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

基于函数计算的 AI 大模型 Serverless 化部署方案与实践

Serverless GPU 方案为 AI 大模型的工程化落地提供了一条轻量级路径。它并非要取代传统的训练集群或高性能算力中心,而是在应用推理层提供了一种更敏捷、更经济的选择。尤其对于处于 MVP 阶段、需要快速验证场景价值的项目,该方案能极大降低技术门槛与资金风险。随着 Serverless 技术的成熟,未来 AI 能力的交付模式将越来越像"调用 API"——开发者无需关心底层算力,只需关注业务

#人工智能#serverless#云原生
【保姆级教程】零成本冷启动:基于函数计算一键部署 Flux 文生图与 GPT-Sovits 语音合成实战

摘要: 本文介绍如何通过阿里云函数计算(FC)低成本部署AI应用,如Stable Diffusion和GPT-Sovits语音克隆。相比传统高硬件投入和复杂运维,Serverless方案支持按量付费、免运维和弹性扩缩容,大幅降低门槛。实操部分详解了ComfyUI+Flux文生图(单图成本低至0.02元)和GPT-Sovits声音复刻(单次语音生成约0.017元)的部署步骤,并推荐32GB内存+16

#人工智能#云计算#阿里云 +1
RAG 落地三部曲:用 Milvus + Qwen3.6 打造企业知识库,我踩过的 5 个坑与解法

很多团队把 RAG 当成"万能胶水",结果向量检索召回率极低、大模型答非所问。本文基于阿里云 Milvus 单机版与百炼 Qwen3.6,复盘了企业知识库落地的完整链路,包含数据清洗、向量化策略、混合检索和重排序的实战代码。

文章图片
#milvus
我在阿里云 PAI 上私有化部署了 Qwen3-Coder,推理成本比公有 API 降低了 60%

团队对代码安全有合规要求,没法直接用云端编码助手。本文记录了我基于阿里云 PAI + vLLM 私有化部署 Qwen3-Coder 的全过程,包括模型选型、推理优化、显存压缩技巧和成本对比,适合有私有部署需求的技术团队参考。

文章图片
#阿里云#云计算
我在阿里云 PAI 上私有化部署了 Qwen3-Coder,推理成本比公有 API 降低了 60%

团队对代码安全有合规要求,没法直接用云端编码助手。本文记录了我基于阿里云 PAI + vLLM 私有化部署 Qwen3-Coder 的全过程,包括模型选型、推理优化、显存压缩技巧和成本对比,适合有私有部署需求的技术团队参考。

文章图片
#阿里云#云计算
到底了