登录社区云,与社区用户共同成长
邀请您加入社区
#Datawhale、#AMDev
Apache 2.0证书,权重公布。可以商用,挺好的,底层技术和gemini是一样的,区别是一个开源一个闭源。
挺好玩的,晚上更新依赖包有点慢。算力是AMD提供的,为AI入门扫清障碍。感谢DatawhaleChina
免费领 200 小时云算力,进群参与显卡、AI PC 幸运抽奖
更多推荐
大模型推理显存不够用,试试 AMD MI300X 上的 PagedAttention 优化
本文详解如何在 AMD MI300X 上利用 PagedAttention 优化解决大模型推理显存不足难题。通过 ROCm 7.x 环境搭建、vLLM 参数调优及 FP8 量化实战,成功在单卡部署 Llama3-70B,显著提升显存利用率与并发性能,为低成本大模型推理提供高效方案。
GitHubDaily:一个坚持了十年的开源项目推荐账号
GitHubDaily是一个坚持十年的开源项目推荐平台,在GitHub上获得4.6万Star。自2015年成立以来累计分享超1万个开源项目,内容涵盖AI工具(如PDF转Markdown、语音转文本)、开发工具(终端AI助手、网页爬虫)、学习教程和媒体工具等。创始人受"通过阅读源码学习编程"理念启发,致力于帮助开发者发现优质项目、提升技术能力。该平台适合希望了解技术动态、提升编程水平或寻找特定工具的
AMD Instinct 显卡上跑 vLLM,ROCm 7.x 环境配置避坑实录
本文详解在 AMD Instinct 显卡上部署 vLLM 的实战流程,聚焦 ROCm 7.x 环境配置避坑指南。涵盖用户权限设置、驱动验证、源码编译关键变量及显存优化策略,助开发者快速搭建高效大模型推理服务,解决常见崩溃与兼容难题。
扫一扫分享内容
为遵守国家网络实名制规定,未绑定将限制内容发布与互动
所有评论(0)