logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

FlagOS(众智FlagOS)面向大模型、支持异构算力的开源系统软件栈,支持华为、寒武纪等几乎所有芯片,算子,算子库的名词解释

算子(Operator,简称 OP)是深度学习中的基本计算单元,可以理解为对张量(Tensor)执行的具体计算操作。算子名称功能说明应用场景MatMul矩阵乘法全连接层、注意力机制卷积运算图像特征提取Softmax归一化指数函数分类输出、注意力权重ReLU激活函数引入非线性LayerNorm层归一化稳定训练Concat张量拼接特征融合Pooling池化操作降维、特征压缩。

#开源
`transformers` 的 `per_device_train_batch_size` 不支持小于 1 的浮点数值,llamafactory 支持

需求正确做法想要更小的"等效batch size"调大显存不够但想 batch_size=1用+ 8-bit 优化器物理上必须拆分单个样本自定义你的实际场景是什么?(显存限制?还是算法需要小batch?)我可以给更具体的代码。

#batch#人工智能#算法
超算中心 华东一区 赠送的7185-32C-128G-4卡 不能用于人工智能训练 异构加速卡1 VASP、LAMMPS、CFD** 这类**离线批处理任务

这是一台正经超算节点,不是 AI 训练卡。超算中心不让你跑 AI Notebook,是硬件架构 + 软件生态 + 调度策略共同决定的,不是故意限制你。如果你告诉我这张加速卡具体型号,我可以帮你精确判断是哪一类、有没有可能勉强跑轻量 AI。

#人工智能
趋动云 国家超算中心 等云服务器 的高速硬盘 寻找和测速,解决模型加载慢的问题,模型要放到高速硬盘

云服务器 的有低速硬盘ssd nvme 高速硬盘,如何寻找。趋动云是/tmp 根据不同的付费规格,不同的限制。(SATA 级别或受限 NVMe)。

#服务器#运维#人工智能
BW/昆仑芯 国产GPU 上面微调模型 lora 异构GPU DPUPaddlePaddle/PaddleNLP 完全支持 ,unsloth似乎不支持

PaddlePaddle/PaddleNLP 完全支持 DeepSeek-R1 14B 的微调原生集成 DeepSeek-R1-Distill 系列,无需手动转换提供从 1.5B 到 70B 全系列蒸馏模型的训练支持针对国产 AI 芯片(包括您之前提到的 BW/昆仑芯)有专门优化支持 128K 长文本训练和多种高效微调方法如果您需要在国产异构加速卡 BW上运行,PaddlePaddle 是目前最可

#人工智能#编辑器
国产GPU与ROCm架构的关系 国产GPU架构总结 ROCm 7.1 在 PyTorch 官网上被划掉(横线)直接支持

国产GPU并非都是ROCm架构✅只有海光信息是通过正规商业授权使用AMD/ROCm架构❌摩尔线程、壁仞、沐曦、天数智芯等都是完全自主研发架构,通过软件层兼容CUDA,与ROCm无关❌华为昇腾、寒武纪等走完全独立的技术路线因此,"国产GPU都是ROCm架构"是一个误解。实际上,绝大多数国产GPU厂商都在努力构建自主可控的软件生态,而非依赖AMD的ROCm授权。横线划掉 ROCm 7.1 是 PyTo

#架构#pytorch#人工智能
国产GPU与ROCm架构的关系 国产GPU架构总结 ROCm 7.1 在 PyTorch 官网上被划掉(横线)直接支持

国产GPU并非都是ROCm架构✅只有海光信息是通过正规商业授权使用AMD/ROCm架构❌摩尔线程、壁仞、沐曦、天数智芯等都是完全自主研发架构,通过软件层兼容CUDA,与ROCm无关❌华为昇腾、寒武纪等走完全独立的技术路线因此,"国产GPU都是ROCm架构"是一个误解。实际上,绝大多数国产GPU厂商都在努力构建自主可控的软件生态,而非依赖AMD的ROCm授权。横线划掉 ROCm 7.1 是 PyTo

#架构#pytorch#人工智能
国产GPU与ROCm架构的关系 国产GPU架构总结 ROCm 7.1 在 PyTorch 官网上被划掉(横线)直接支持

国产GPU并非都是ROCm架构✅只有海光信息是通过正规商业授权使用AMD/ROCm架构❌摩尔线程、壁仞、沐曦、天数智芯等都是完全自主研发架构,通过软件层兼容CUDA,与ROCm无关❌华为昇腾、寒武纪等走完全独立的技术路线因此,"国产GPU都是ROCm架构"是一个误解。实际上,绝大多数国产GPU厂商都在努力构建自主可控的软件生态,而非依赖AMD的ROCm授权。横线划掉 ROCm 7.1 是 PyTo

#架构#pytorch#人工智能
2026年国际国外top10 top20流行的ai ide,

(AI能自主处理多步任务)、全代码库上下文理解、自然语言驱动开发,以及与现有工作流的深度融合。Cascade AI支持多步自动编辑、自然语言指令,免费且性能优秀,适合追求干净体验的独立开发者。企业级可靠,与Git工作流无缝集成,使用量巨大,适合团队和开源开发者。支持自然语言生成完整项目、Figma转代码、多模态交互,在本土化和全场景适配上表现突出,2026年黑马。Anthropic推出的终端代理工

#人工智能#ide
    共 229 条
  • 1
  • 2
  • 3
  • 23
  • 请选择