logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Day-0支持|摩尔线程TileLang-MUSA率先支持DeepSeek-V4全新TileKernels

摩尔线程宣布其TileLang-MUSA成为TileLang官方主线版本,实现对DeepSeek-V4最新TileLang算子库TileKernels的"Day-0"支持,为国产GPU上的大模型算子迁移和优化奠定基础。TileLang-MUSA已开源,测试覆盖率超95%,显著提升国产GPU开发效率。这一进展标志着国产AI大模型与GPU深度融合,摩尔线程将持续投入开源生态建设,推

文章图片
基于 MUSA 的大语言模型推理和服务框架vLLM

通过使用musify工具,用户可以快速将原有的CUDA代码无缝迁移到MUSA软件栈,大大提升了用户在MUSA软件栈上开发的效率。musify工具是一个文本替换工具,用于将用户代码中CUDA相关的接口转换为MUSA的对应接口,然后使用MUSA软件栈下的mcc编译器编译成为摩尔线程GPU的可执行文件。另外MUSA的一大优势是CUDA兼容,通过musify工具,我们可以快速将官方代码移植至MUSA软件栈

文章图片
#语言模型#人工智能#深度学习
摩尔线程携手紫光计算机发布《语音识别全栈国产化技术实践白皮书》

然而,传统语音识别方案在面对复杂噪声环境、专业术语、长音频转写及高并发场景时,往往存在延迟高、准确率下降、部署成本难控等问题,亟需新一代软硬协同方案实现突破。以国产全功能GPU为基石,以国家级权威检测认证为技术验证,摩尔线程与紫光计算机通过《语音识别全栈国产化技术实践白皮书》分享的技术方案,在低噪、高噪环境下均实现了超过97%的关键词识别准确率与超过99%的连续语音识别准确率,为行业提供了一条高精

文章图片
#语音识别#人工智能
Day-0支持|摩尔线程TileLang-MUSA率先支持DeepSeek-V4全新TileKernels

摩尔线程宣布其TileLang-MUSA成为TileLang官方主线版本,实现对DeepSeek-V4最新TileLang算子库TileKernels的"Day-0"支持,为国产GPU上的大模型算子迁移和优化奠定基础。TileLang-MUSA已开源,测试覆盖率超95%,显著提升国产GPU开发效率。这一进展标志着国产AI大模型与GPU深度融合,摩尔线程将持续投入开源生态建设,推

文章图片
摩尔线程 × 上海AI实验室|基于S5000和KernelSwift实现DeepSeek-V4核心算子Day-0适配

DeepSeek-V4预览版发布当天,摩尔线程通过智能算子迁移系统KernelSwift,在MTTS5000智算卡上实现了80%以上核心算子的Day-0适配。KernelSwift将适配周期从数月缩短至小时级,支持多元国产芯片的"开箱即用"。MTTS5000凭借原生FP8精度支持,为模型提供高效算力底座。经协同优化,21个核心算子均获加速,自动生成算子正确率达100%,展现了国

文章图片
#人工智能
从代码合入到社区共聚:SGLang × MUSA Meetup圆满落幕,国产GPU开源生态进入“原生支持”时代

目前,基于MUSA的SGLang已支持DeepSeek、Qwen、GLM等主流大模型及Wan、LTX等视频生成模型,在MTT S5000等硬件上实现真正的“开箱即用”与无缝加速,显著降低了开发者的算力迁移门槛。通过与SGLang、TileLang、Triton、Mooncake等开源社区的紧密协作,摩尔线程不仅推动了MUSA平台与主流AI框架的深度适配,更。,未来12个月应优先建立跨层级的统一抽象

文章图片
#sglang#开源
摩尔线程 × 光轮智能|强强联手,共筑国产具身智能仿真底座

与此同时,光轮依托首创物理测量工厂与虚实对标方法论,将真实世界中的质量、摩擦、接触、形变等关键物理参数引入仿真环境,结合SimReady标准体系,确保仿真资产可验证、可复用、可规模化,,构建覆盖场景构建、任务生成、仿真执行到评测验证的闭环,形成以RoboFinals为代表的系统化评测能力,结合摩尔线程国产GPU算力底座与大规模并发能力,实现位姿、物性、视角与环境条件等维度的高效泛化,推动具身数据从

文章图片
#人工智能
筑基AI4S:摩尔线程全功能GPU加速中国生命科学自主生态

精准医疗与药物研发正被人工智能深刻重塑。作为AI for Science(AI4S)领域的核心阵地,解码生命奥秘的关键已从实验观测转向算力与算法的协同突破。蛋白质结构预测、基因组分析与医学影像,构成了生命科学AI的三类关键技术,其能力直接决定了新药研发的效率与精准医疗的进程。

文章图片
筑基AI4S:摩尔线程全功能GPU加速中国生命科学自主生态

精准医疗与药物研发正被人工智能深刻重塑。作为AI for Science(AI4S)领域的核心阵地,解码生命奥秘的关键已从实验观测转向算力与算法的协同突破。蛋白质结构预测、基因组分析与医学影像,构成了生命科学AI的三类关键技术,其能力直接决定了新药研发的效率与精准医疗的进程。

文章图片
技术研究 | 解码GPT-4o用文字泼墨成图的算力密码

语言是画笔,GPU是画布与调色板,没有画布与调色板,语言这支画笔再精妙也无法将创意具象化,二者共同成就了艺术家的无限可能。GPT-4o 的图像生成功能与 GPU 之间存在的密切关系主要体现在:计算需求、性能优化以及资源利用效率等方面。

文章图片
#人工智能#深度学习
    共 21 条
  • 1
  • 2
  • 3
  • 请选择