logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【debug日记】排查已损坏的npz文件(AI自动总结)

更令人困惑的是,当我在调试器 (Debugger) 中暂停并检查一个所谓的“损坏”文件对象时,它的属性看起来一切正常,甚至可以正确显示内部包含的文件列表(如。) 的0维对象数组。这个修正后的脚本,其运行结果与模型训练时的表现完全一致,最终精准地定位了那几个真正损坏的文件,问题得以解决。时,它只读取了文件的元数据和头部信息(就像只看一本书的目录),并不会立即解压和加载文件中的所有数据。:验证脚本的核

#人工智能
【项目笔记】DeepSeek+LoRA+FastAPI:开发人员如何微调大模型并暴露接口给后端调用

解决:使用 Node.js 官方二进制文件安装(无需管理员权限)复制该地址到浏览器报错:localhost 拒绝连接。解决:使用官方二进制文件安装(无需管理员权限)3.安装好mvn后执行。

文章图片
#fastapi
【昇腾】从单机单卡到单机多卡训练

在多进程环境中,数据共享是一个挑战。torch.multiprocessing 允许在进程之间共享 PyTorch 张量,这些张量存储在共享内存中,而不是在进程之间复制数据。DDP通过在每个进程中创建模型的一个副本,并在每个副本上独立地进行前向和反向传播,从而实现并行计算。在每个训练步骤后,DDP自动同步各个进程计算出的梯度,确保所有进程的模型参数保持一致。这个采样器的设计目的是确保在分布式训练过

文章图片
【昇腾】训练过程中功率监测,和英伟达4090对比

【代码】【昇腾】训练过程中功率监测,和英伟达4090对比。

文章图片
#python#开发语言
    共 31 条
  • 1
  • 2
  • 3
  • 4
  • 请选择