logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

开源GPU创新生态赛赛题二 | vLLM-MACA配置手把手教程

本文将带你一步步完成的环境配置与安装,实测可用于国产GPU生态环境下的开发调试。

文章图片
#开源#python
开源GPU创新生态赛赛题三 | mcTileLang 算子任务文档(按 Level 分级)

案例要求:包含数据准备、算子调用、结果可视化(如打印特征图形状、注意力权重热力图)、性能分析代码,提交代码 PR 并附运行演示截图。完成 CUDA 相关文档向 MACA 适配,实现补充算子说明文档。熟悉 mc_tilelang 基础功能,验证现有文档的可复现性。编写未完成的算子文档,补充已有文档的 MACA 深度解析。开发复杂融合算子或贡献示例代码,满足大模型推理等高阶需求。文件夹新增其他算子的完

文章图片
#开源#python
开源GPU创新生态赛赛题三 | mcTileLang 算子任务文档(按 Level 分级)

案例要求:包含数据准备、算子调用、结果可视化(如打印特征图形状、注意力权重热力图)、性能分析代码,提交代码 PR 并附运行演示截图。完成 CUDA 相关文档向 MACA 适配,实现补充算子说明文档。熟悉 mc_tilelang 基础功能,验证现有文档的可复现性。编写未完成的算子文档,补充已有文档的 MACA 深度解析。开发复杂融合算子或贡献示例代码,满足大模型推理等高阶需求。文件夹新增其他算子的完

文章图片
#开源#python
开源GPU创新生态赛赛题三 | mcTileLang 算子任务文档(按 Level 分级)

案例要求:包含数据准备、算子调用、结果可视化(如打印特征图形状、注意力权重热力图)、性能分析代码,提交代码 PR 并附运行演示截图。完成 CUDA 相关文档向 MACA 适配,实现补充算子说明文档。熟悉 mc_tilelang 基础功能,验证现有文档的可复现性。编写未完成的算子文档,补充已有文档的 MACA 深度解析。开发复杂融合算子或贡献示例代码,满足大模型推理等高阶需求。文件夹新增其他算子的完

文章图片
#开源#python
GPU 开源生态挑战赛 - 赛题二与 Issue 对应清单

子赛题二鼓励所有参赛者积极参与国产算力生态建设,通过真实的上游贡献推动 MACA、InfiniCore、MinerU 等开源社区协同发展。无论是文档编写、模型迁移还是算子优化,每一次有效的贡献,都是推动国产 AI 生态自立自强的重要一步。欢迎大家踊跃参与,共同建设开放、可持续的国产 AI 开源生态!

文章图片
#开源#issue
开源GPU创新生态赛常规赛第一期(S1)| 赛题二解读

子赛题二旨在通过开源协作与技术创新,推动国产 AI 生态在算力适配、模型迁移与性能优化方向的共同发展。参赛者不仅需要具备代码实现与性能验证能力,更应重视开源协作流程的规范性,包括:Issue 编写完整清晰:明确任务目标、背景与预期结果,方便评审与上游开发者理解;PR 对应关系规范:确保每个 PR 仅关联一个主要 Issue;材料提交完整(按需提交):提交内容应包含代码、部署脚本、环境配置、测试用例

文章图片
#开源
到底了