
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
阿里发布新一代视觉语言大模型Qwen3-VL系列,包括4B和8B版本,昇思MindSpore第一时间完成适配支持。该系列在文本理解、视觉感知、空间推理等方面全面升级,支持256K长文本处理、多语言OCR识别等功能。昇思社区提供完整的推理指南,包含模型下载、Docker镜像部署及中英文图片描述生成示例。开发者可通过指定服务器配置,快速体验模型的多模态能力。模型权重和代码已开源,支持从边缘到云的灵活部
阿里云发布Qwen3-Next系列大模型,包括80B参数的Thinking和Instruct版本,主打长文本处理与参数效率。该模型通过HybridAttention、High-SparsityMoE等创新技术提升性能,训练成本仅为Qwen3-32B的十分之一。昇思MindSporeAI框架已实现快速支持,提供完整推理部署方案,支持8卡Atlas服务器运行。开发者可通过魔乐社区下载模型(约152GB
本文深入解析了MindSpore框架中动态图与静态图的特性差异,重点介绍了Graph模式及其核心@jit装饰器的使用。通过实战对比展示了在Ascend NPU上,静态图模式相比动态图模式可获得显著性能提升(实测从1.5秒优化至0.05秒)。文章详细阐述了@jit的工作原理,包括首次运行时的图编译过程,并指出了静态图语法的限制(如第三方库使用、控制流约束等)。最后提供了查看IR图的进阶技巧,帮助开发
本文深入解析了MindSpore框架中动态图与静态图的特性差异,重点介绍了Graph模式及其核心@jit装饰器的使用。通过实战对比展示了在Ascend NPU上,静态图模式相比动态图模式可获得显著性能提升(实测从1.5秒优化至0.05秒)。文章详细阐述了@jit的工作原理,包括首次运行时的图编译过程,并指出了静态图语法的限制(如第三方库使用、控制流约束等)。最后提供了查看IR图的进阶技巧,帮助开发
本文深入解析了MindSpore框架中动态图与静态图的特性差异,重点介绍了Graph模式及其核心@jit装饰器的使用。通过实战对比展示了在Ascend NPU上,静态图模式相比动态图模式可获得显著性能提升(实测从1.5秒优化至0.05秒)。文章详细阐述了@jit的工作原理,包括首次运行时的图编译过程,并指出了静态图语法的限制(如第三方库使用、控制流约束等)。最后提供了查看IR图的进阶技巧,帮助开发
本文介绍了MindSpore深度学习框架中的核心概念:计算图和nn.Cell模块。计算图作为AI模型的"蓝图",分为静态图(GRAPH_MODE)和动态图(PYNATIVE_MODE)两种执行模式,前者优化性能而后者便于调试。nn.Cell是构建网络的基础模块,通过继承并实现__init__和construct方法,可以像搭积木一样组合各种神经网络层。文章以线性网络y=W*x+
区别于当前以文本为主的大部分语言大模型,“紫东太初”大模型在研发之初即坚持以多模态技术为核心,利用图-音-文等更多类型数据进行跨模态的统一表征和学习,实现了图像、文本、语音三模态数据间的“统一表示”与“相互生成”,使人工智能大模型的理解和生成能力更加接近人类,为贯通多模态人工智能行业应用提供了创新基础,向通用人工智能迈出关键一步。世界已经进入了数字物联时代。,可实现文本、图片、语音、视频、3D点云

ML是近十年来发展迅速、最有前途的技术,几乎应用于所有商业领域和研究领域。在许多领域(如医疗诊断),与传统应用程序相比,ML在提供结果方面表现出优势,并在某些活动中表现出优于人类智慧。这些趋势引发了对数据、AI科学家以及软件开发人员的巨大需求。早期研究表明,构建算法(即开发ML模型)只是成功开发并运行基于AI的软件系统所需全部工作的一小部分。ML软件实现与传统软件的区别在于,它们的逻辑不是显式编程

在典型案例中,流场预测大模型将单个机翼样本的耗时从小时级缩短到秒级,实现5个数量级加速,分布载荷和集中力相对误差小于1%。同时,在模型算法设计、混合精度加速,以及数值求解耦合并行优化等方面进行了创新与验证,实现了高置信度流场重构、全速域湍流场求解和复杂流场近实时预测。大会以“数智聚合,共创行业新价值”为主题,邀请政府领导、院士专家、企业、行业组织等超过750位嘉宾齐聚探讨算力产业集群建设、应用推广

启智社区与MindSpore联合,为MindSpore开发者提供 365天*24小时 上百万卡时的MindSpore+NPU普惠算力,欢迎MindSpore产学研开发者申请,基于MindSpore开发你自己的模型算法套件和应用嘿~因为了解到日理万机的你可能没有时间仔细阅读完整篇文章,所以我们在开头贴心地附上一份概览,来供大家参考(想要了解详情的小伙伴可以下滑解锁具体内容哦)~想知道更多内幕?那么请








