logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Triton 入门实践 | Triton 调优实战

Triton 的 Python API 里除了 triton.jit 还有 triton.autotune,triton heuristics,triton.Config 等接口用于调优以生成性能更好的 kernel

文章图片
#人工智能#性能优化#服务器
Triton入门实践 | 算子性能优化:自动调优的艺术

Triton 以其低门槛开发和抽象的硬件细节处理,成为开发者的优选。对于渴望参与 Triton 开源社区建设的开发者来说,优化 Triton 算子是一条理想的路径。优化后的 Triton 算子性能有望匹敌甚至超越 PyTorch 的原生实现。正如古人云:“工欲善其事,必先利其器”,本文将介绍 Triton 算子优化的利器——自动调优(autotune)。

文章图片
#性能优化#人工智能
社区活动 | Triton中国社区贡献者茶话会圆满落地

11月30日周六下午,Triton中国社区的成员们齐聚一堂,参与了一场特别的茶话会。这场活动不仅是对开源社区贡献者辛勤工作的感谢,也是对未来发展方向的深入探讨.。

文章图片
#人工智能
Triton 入门指南 | isin算子性能优化

Triton 面向的是数据块编程,屏蔽了大多数硬件细节,降低了开发门槛。开发人员可以专注于数据块划分和算法设计。通过合理的算法设计,Triton 实现的算子完全有可能在性能上超越 pytorch 中的 cuda 实现。

文章图片
#人工智能
Triton入门指南|Triton DSL的特点与类型

Triton官方将其DSL语法表达体系称为 triton.language(https://triton-lang.org/main/python-api/triton.language.html),是一种依托于python环境的DSL,从该命名中的“language”中不难窥见,Triton团队想用自成一派的语言(language)对面向GPU的编程模型进行独特的表达,在Triton中,DSL由

文章图片
#人工智能
Triton 中国生态 Meetup 第二期

9月7日周六下午,智源研究院将举办Triton 中国生态Meetup第二期,届时来自智源、硅基流动、天数智芯的技术专家将为大家带来 Triton前沿技术及案例分享,从研发进展到实战技巧,带你全面解锁Triton潜力!

文章图片
Triton&vLLM WorkShop

智源人工智能研究院于 10 月 17 日下午,在位于北京市海淀区丰智东路13号朗丽兹西山花园酒店的GOSIM开源盛会上,成功举行了Triton&vLLM联合WorkShop。这场盛会不仅吸引了上百位 Triton 技术爱好者的积极参与,更通过线上直播吸引了近万名观众的热情参与,共同见证了 Triton 技术的精彩分享和深入探讨。

文章图片
Triton中国社区正式启动开发者贡献计划

Triton中国社区贡献者招募计划启动!点击了解详情进行报名

文章图片
活动回顾|Triton&vLLM WorkShop

智源人工智能研究院于10 月 17 日下午,在位于北京市海淀区丰智东路13号朗丽兹西山花园酒店的GOSIM开源盛会上,成功举行了Triton&vLLM联合WorkShop。

文章图片
活动报名 | Triton &vLLM联合WorkShop重磅来袭

Triton &vLLM联合WorkShop重磅来袭,点击文章立即报名!

文章图片
#人工智能
    共 15 条
  • 1
  • 2
  • 请选择