logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

MindFormers文本生成接口

摘要:MindFormers的.generate()接口是大模型文本生成的核心工具,支持单条/批量输入、多种生成策略及后处理控制。其参数分为五类:输入数据(token序列)、生成配置(采样/长度等)、后处理(logits加工)、流式输出(实时反馈)和扩展控制(附加参数)。接口设计兼具灵活性(支持高阶定制)与易用性(兼容主流范式),适用于对话系统、代码生成等场景。通过分层参数控制,既能满足基础需求,

#人工智能#神经网络#性能优化
MindSpore SPONGE暑期学校火热招生中,分子计算课程等你来

北京大学化学与分子工程学院(名额有限,请大家填写报名表单的同时一定加入课程群组,最终线下参与学员将会在群内或者邮件通知您,线下将提供免费云算力平台供实操体验)。8月21日~25日 每天的8:30~12:00、14:00~17:00、19:00~20:30。

文章图片
#人工智能#深度学习
MindSpore 大模型训练进阶:高效显存管理 + 增量式断点续训的实践

在千亿参数大模型(如 LLaMA-7B/13B)的训练场景中,显存瓶颈与训练中断恢复是两大核心痛点 —— 前者直接限制模型规模,后者会导致工业级训练的时间与算力成本翻倍。本次分享基于 MindSpore 的高阶训练特性,构建 “分层显存优化 + 增量式断点续训” 的工业级大模型训练方案,实现单卡支持 7B 模型全量训练、断点恢复耗时从小时级降至分钟级,同时通过算子级优化将训练吞吐量提升 35%。方

#windows#人工智能#深度学习 +1
【昇思MindSpore技术公开课】请查收第三讲ChatGLM2知识点回顾

上周六的第三节课程中,我们讲解了从ChatGLM到ChatGLM2的技术改进点,同时带领大家在OpenI启智社区云脑算力上,使用Ascend+ModelArts+MindSpore部署ChatGLM2聊天机器人,并且介绍了最近开源的ChatGLM3的相关特性。未报名的小伙伴抓紧时间扫描下方二维码参与课程,并同步加入课程群,有免费丰富的课程资源在等着你。ChatGLM2在ChatGLM基础上,除了使

文章图片
#人工智能#量子计算#深度学习 +1
MindSpore 进阶:彻底搞懂函数式自动微分与自定义训练循环

本文介绍了在MindSpore 2.x框架下构建自定义训练循环的方法。相比High-Level API,自定义训练循环提供了更高灵活性,适合复杂算法如GAN、强化学习等场景。文章详细展示了如何在Ascend NPU上实现:1)环境设置与基础网络构建;2)利用ops.value_and_grad实现自动微分;3)通过@ms.jit装饰器优化性能;4)完整训练循环实现;5)进阶技巧如梯度累积处理。该方

#神经网络#深度学习#网络
特斯联携手华为发布联合解决方案,助力京津冀千行百业智能升级

特斯联与华为联合发布的智能数据治理联合解决方案基于华为昇腾算力和全场景AI 框架昇思MindSpore打造,融汇特斯联基于产业服务需求打造的行业数据管理平台,内置特斯联AI CITY智慧场景标准、模型、指标和算法,提供从数据采集、治理、开发到开放的数据全生命周期治理服务,支撑从算法开发、算法测试到算法推理的 AI 全生命周期管理服务,极大提升 AI 算法开发和落地效率,同时也降低了开发和落地的成本

文章图片
#华为
MindSpore高阶接口与大模型开发实战

摘要:本文系统介绍了MindSpore高阶API在大模型开发中的应用价值与实践方法。高阶API通过封装底层算子,简化了模型构建、训练流程和数据预处理等复杂环节,显著提升开发效率和代码可读性。文章详细解析了nn.Cell、Model等核心接口的使用方法,并展示了如何从基础使用进阶到自定义开发。通过Baichuan13B和InternLM-LoRA两个典型案例,验证了高阶API在国产大模型开发中的实际

#学习#神经网络#深度学习
昇腾CANN ATC模型量化与MindSpore推理部署全流程

本文详细介绍了在昇腾AI平台中,使用ATC工具实现ResNet50模型量化与推理部署的全流程。通过MindSpore模型训练导出、ATC量化配置、模型转换及推理部署等步骤,最终实现量化后模型推理速度提升1.8倍,内存占用降低60%。文章提供了完整的环境配置、代码实现和性能优化方案,涵盖量化配置、校准数据集准备、推理类封装等核心内容,并针对常见问题给出解决方案。所有代码均在Ubuntu 20.04、

#学习#人工智能#算法
昇腾CANN ATC模型量化与MindSpore推理部署全流程

本文详细介绍了在昇腾AI平台中,使用ATC工具实现ResNet50模型量化与推理部署的全流程。通过MindSpore模型训练导出、ATC量化配置、模型转换及推理部署等步骤,最终实现量化后模型推理速度提升1.8倍,内存占用降低60%。文章提供了完整的环境配置、代码实现和性能优化方案,涵盖量化配置、校准数据集准备、推理类封装等核心内容,并针对常见问题给出解决方案。所有代码均在Ubuntu 20.04、

#学习#人工智能#算法
昇腾CANN ATC模型量化与MindSpore推理部署全流程

本文详细介绍了在昇腾AI平台中,使用ATC工具实现ResNet50模型量化与推理部署的全流程。通过MindSpore模型训练导出、ATC量化配置、模型转换及推理部署等步骤,最终实现量化后模型推理速度提升1.8倍,内存占用降低60%。文章提供了完整的环境配置、代码实现和性能优化方案,涵盖量化配置、校准数据集准备、推理类封装等核心内容,并针对常见问题给出解决方案。所有代码均在Ubuntu 20.04、

#学习#人工智能#算法
    共 772 条
  • 1
  • 2
  • 3
  • 78
  • 请选择