Anrey. 个人主页

@weixin_42123971

Anrey.

2022-06-28 15:24:06 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

昇腾MindStudio支持DeepSeek-V4模型W8A8量化

4月24日，DeepSeek-V4发布，模型支持百万字超长上下文，在 Agent 智能交互、通用世界知识与逻辑推理能力方面，综合性能位居国内及开源领域前列。昇腾MindStudio 模型量化工具支持模型W8A8量化，适配昇腾A2、A3及950全系列产品，实现模型轻量化部署，进一步提升推理性能。

#人工智能 #昇腾

昇腾MindStudio支持DeepSeek-V4模型W8A8量化

#人工智能 #昇腾

昇腾MindStudio支持DeepSeek-V4模型W8A8量化

#人工智能 #昇腾

昇腾MindStudio支持DeepSeek-V4模型W8A8量化

#人工智能 #昇腾

MindStudio全新轻量级指标采集库：零代码侵入，动态开关随心控

metrics:label:# 不配置将直接使用内置默认配置 export MS_SERVICE_METRIC_CONFIG_PATH = /path/to/metric_config.yaml具体配置项说明可以参考：https://gitcode.com/Ascend/msserviceprofiler/blob/master/ms_service_metric/README.md[#ms](j

#昇腾 #人工智能

MindStudio全新轻量级指标采集库：零代码侵入，动态开关随心控

#昇腾 #人工智能

MindStudio支持PyTorch Memory Snapshot，内存分析更丝滑

在强化学习场景下存在多个不同的任务阶段，其内存变化比较大，可以使用 PyTorch Profiler 中的 profile_memory 数据或者 Snapshot 数据来分析内存使用，特别是 Snapshot，其可以查看内存使用细节，在深入分析时非常有用。

#人工智能 #昇腾 #华为

告别参数泥潭！MindStudio快速锁定大模型推理服务化吞吐最优解

MindStudio服务化自动寻优工具，通过仿真建模，自动搜索推荐最优配置参数，帮助开发者告别繁琐的参数调试流程，有效减少反复分析服务化参数-实测-再分析的试错过程，大幅提升服务化调优效率。目前该工具已正式发布，欢迎广大开发者点击链接下载体验！msserviceprofiler/docs/服务化自动寻优工具.md · Ascend/msit - Gitee.com。

#昇腾

MindStudio全新支持训练数据在线监测，大幅提升训练效率

在AI计算领域，随着模型规模不断扩大，如何突破训练性能瓶颈已成为开发者面临的关键挑战。特别是在大规模分布式训练场景下，传统性能监测方案存在明显不足：其一，采用被动式监测策略，往往在性能抖动发生后才能触发数据采集，导致问题定位存在延迟；其二，面对训练过程中产生的海量性能数据（通常达数百GB量级），传统方案的解析和转储效率低下，进一步延长了问题诊断周期。这些缺陷不仅影响排障效率，更会造成计算资源浪费。

#昇腾

揭开算子精度调试黑箱，MindStudio算子工具助力开发效率大幅提升

msSanitizer 与 msDebug 作为 MindStudio 算子工具链的重要能力，分别从 “异常预防” 和 “问题溯源” 两个维度发力，为昇腾 NPU 算子的精度调试提供了系统化解决方案，是提升算子开发质量与效率的关键利器，目前该工具已正式发布，更多功能请参考官方资料。

#人工智能 #昇腾

共 14 条

请选择