
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
昇思 MindSpore 是华为推出的全场景 AI 深度学习框架,旨在弥合算法研究与生产部署之间的鸿沟。MindSpore = PyTorch 的开发体验 + TensorFlow 的部署能力 + 昇腾硬件的深度优化以下从使用范围层面技术实现层面。
第五季的核心是「技能分层+按需加载第一层(系统提示):低成本常驻,让模型知道「有什么技能」;第二层(load_skill工具):高成本按需加载,让模型获取「技能的完整规则」;对比第四季:第四季解决「上下文膨胀」(横向隔离),第五季解决「系统提示冗余」(纵向按需),两者结合能支撑更复杂的Agent系统。面试时重点说清「两层注入」的逻辑:为什么要分层(代币浪费)、怎么分层(摘要+完整内容)、怎么落地(
边缘计算是为应用开发者和服务提供商在网络的边缘侧提供云服务和IT环境服务;目标是在靠近数据输入或用户的地方提供计算、存储和网络带宽。边缘计算本质上是一种服务,类似于云计算、大数据服务,但这种服务的特点是非常靠近用户。为什么要靠近用户?计算能力部署在设备侧附近,对设备的请求能实时响应;**2.低带宽运行:**将工作迁移到更接近于用户或是数据采集终端,能减少站点带宽带来的限制,尤其是当边缘节点减少了向

给定一组包含猫和狗图像的数据集,并且每张图像都有相应的标签(是猫还是狗),监督式学习算法可以学习如何从图像中提取特征,并预测新图像中是否有猫或狗。例如,使用聚类算法对一组顾客的购买历史进行分组,以发现具有相似购买模式的顾客群体,而无需事先知道每个顾客的标签或类别。模型试图在数据中找到某种形式的组织或聚类,而无需事先知道该数据的标签。一旦模型经过训练,它可以用于预测未见过的输入数据的输出标签。来调整

通过对比粗粒度与细粒度 Skill 的应用表现,论证了**“细粒度 Skill 拆解 + 任务动态编排”**在处理多变量决策(如时间、预算、身体状况、人数)时的绝对优势。在涉及多变量决策、用户画像动态变化、外部环境复杂的 AI Agent 开发中,细粒度 Skill 不仅是更好的选择,而是唯一的工程级解法。:在处理复杂、多变量、且具有模糊边界的任务时,细粒度 Skill + 任务分解是唯一可靠的解
常规的编译(比如 C/C++ 的编译)是 “提前做好饭”:代码写完后一次性编译成机器能直接执行的二进制指令,运行时直接用;而JIT 编译是 “点单后现做饭”:代码在首次运行时才会被编译器实时编译成硬件(这里是 NPU)能执行的二进制指令,这个编译过程会消耗额外的时间和资源。
CANN :算子库版本为 8.1 和 MindSpore 版本不匹配,但任务要求你使用 MindSpore NLP == 0.5.1。因为 fork 的仓库默认一般只有 master 分支,我们提交到 dev 分支上。需要用到 NPU ,而 NPU 和 Huggingface 上模型的桥梁是 MindSpore NLP 这个库。NPU:加载模型需要在代码层面先显示设置需要绑定的设备,而不能在模型加
核心模块(模型构建)、(张量计算)、(数据处理)是CV开发的三大核心模块;CV关键操作:卷积层(特征提取)、转置卷积(上采样)、数据增强(提升泛化)、损失函数(分类/回归)是计算机视觉的核心操作;训练流程:数据集构建→模型定义→损失/优化器配置→前向传播+梯度计算→参数更新是MindSpore训练模型的标准流程。
架构:混合注意力 + 稀疏MoE + M-RoPE,兼顾速度、效果、显存参数:0.8B总参,激活仅350M,小算力训大模型显存:训练最低24GB,推理12GB,平民硬件可跑数据:100G数据需要8卡24GB训练15天,4卡A100训练7天这份代码是工业级可用的MoE大模型,直接可用于预训练、微调、推理部署!
通过对比粗粒度与细粒度 Skill 的应用表现,论证了**“细粒度 Skill 拆解 + 任务动态编排”**在处理多变量决策(如时间、预算、身体状况、人数)时的绝对优势。在涉及多变量决策、用户画像动态变化、外部环境复杂的 AI Agent 开发中,细粒度 Skill 不仅是更好的选择,而是唯一的工程级解法。:在处理复杂、多变量、且具有模糊边界的任务时,细粒度 Skill + 任务分解是唯一可靠的解







