
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
AI 芯片编程正迎来一场静默革命——你是否也曾因 CUDA 的复杂性望而却步?是否渴望一种既像 Python 一样易写,又能媲美 GPU 原生性能的编程方式?现在,答案来了:Triton,正在重塑 AI 编程的新范式! 2026年1月9日,由众智 FlagOS 开源社区、北京智源人工智能研究院、CSDN联合主办的Triton Next 技术大会将在北京中关村国家自主创新示范区展示中心隆重举行。这是

FlagRelease大模型迁移平台成功适配3个新模型至昇腾、沐曦芯片,累计完成10+主流模型在10+硬件架构的迁移。智源与魔乐社区联合举办"2025全国高性能云计算创新大赛-AI应用打榜赛",提供免费算力及20万元奖金池,邀请开发者基于这些硬件平台开发AI应用。报名通道已开启,欢迎参赛者报名挑战。

智源研究院联合生态合作伙伴,构建并开源异构统一通信库FlagCX,旨在实现不同芯片之间高效通信和不同场景下的大规模自适应通信优化,填补多元算力开源软件栈的重要版图。

首届FlagOS开放计算开发者大会上发布的众智FlagOS1.5版本在硬件兼容性、技术性能和应用场景等方面取得突破性进展。该系统支持20+芯片型号,实现跨架构统一能力;FlagScale框架实现大模型全流程优化,支持多种模型架构;通过分层设计和算法优化,通信效率提升2.3倍;创新性地引入AIAgent技术,算子开发效率提升4倍;并拓展至具身智能等新应用场景。FlagOS1.5显著降低了AI算力生态

FlagOS 在支持寒武纪算力过程中,在算子、编译器、分布式通信库和并行框架这四大关键组件上取得了重大技术进展与适配成果。

Triton 以其低门槛开发和抽象的硬件细节处理,成为开发者的优选。对于渴望参与 Triton 开源社区建设的开发者来说,优化 Triton 算子是一条理想的路径。优化后的 Triton 算子性能有望匹敌甚至超越 PyTorch 的原生实现。正如古人云:“工欲善其事,必先利其器”,本文将介绍 Triton 算子优化的利器——自动调优(autotune)。

这是国内首个专注于 Triton 技术及其生态的开发者盛会,一场连接未来、代码与创新的相遇。现在,答案来了:Triton,正在重塑 AI 编程的新范式!AI 计算的下一程,需要每一个热爱技术的你。无论你是深耕多年的系统高手,还是对底层充满好奇的初学者,这里都有属于你的席位与声音。这不仅是一场技术分享,更是一次生态的汇聚、一次思维的碰撞、一次未来的共建。✅代表“下一代”编程范式:与编译器、硬件协同进

FlagCX统一通信库发布v0.7.0版本,新增uniRunner全场景统一模式,实现同构/异构芯片的互联互通。该版本基于Kernel-free Non-reduce技术,通过Device-buffer IPC/RDMA能力实现芯片解耦,无需依赖厂商原生通信库。性能测试显示,异构场景下通信带宽提升最高达4.57倍,同时支持10款主流AI芯片。新版本还提供了多芯片编译指南和PyTorch DDP测试

2026年1月9日,由 FlagOS 开源社区和北京智源人工智能研究院联合主办的 “Triton Next 技术大会(TritonNext)”将在北京举行。

FlagEval发布两大AI模型评测榜单:1)安全与价值观榜单对18款主流模型进行3000题测试,ClaudeSonnet4以86.76%合格率居首,头部模型主观题表现优异(97%+),但客观题存在20-25%差距;2)11月角斗场排行榜引入多模型对战机制和深度推理指标,o4-mini、GPT4.1-mini等位列第一梯队。榜单旨在建立科学评估标准,推动AI安全与能力发展。









