logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Imagenet-A,Imagenet-C和ImageNet-O

ImageNet-O 包含来自在 ImageNet-1k 数据集中未发现的类别的图像。对ImageNet 1K添加了一些常见的图像损坏(如模糊和噪声),以评估分类器在面对这些损坏时的性能。这样的评估可以帮助研究人员更全面地了解模型的鲁棒性和泛化能力。该数据集包含 7,500 张经过对抗性过滤的图像,很容易导致机器学习模型的性能显著下降。mCE:用于评估模型在面对不同类型的图像扭曲、噪声或其他损坏时

文章图片
#人工智能
Cursor/VS Code 中,左侧资源管理器字体放大

在 Cursor/VS Code 中,左侧资源管理器(文件树)的字体大小没有单独的设置项,它跟随整体界面缩放级别。

#vscode
github中获得Personal Access Token

访问 GitHub → Settings → Developer settings → Personal access tokens → Tokens (classic)点击 "Generate new token" → "Generate new token (classic)"设置权限(至少需要 repo 权限)生成并复制token。

#github
vscode分布式训练debug

转载:vscode分布式训练debug_分布式ai vscode-CSDN博客

文章图片
#深度学习
通过loss曲线诊断神经网络模型

看loss曲线,如果train loss和val loss都还有下降空间,就继续加大epoch,如果基本平了,加大epoch用处也不大了,如果train loss降val loss降着降着上升了,这说明,模型在val loss由降转升的转折点就收敛了。

文章图片
#神经网络#深度学习#机器学习
BCELoss,BCEWithLogitsLoss和CrossEntropyLoss

等价于:nn.CrossEntropyLoss = nn.NLLLoss(nn.LogSoftmax)输出:一个标量(这个minibatch的mean/sum的loss)两个损失:BCELoss,BCEWithLogitsLoss。输入:([B,C], [B,C])输入:([B,C], [B,C])输入:([B,C], [B])

文章图片
#深度学习#python#pytorch
神经网络算法 - 一文搞懂GAN(生成对抗网络)

StyleGAN 的潜在空间(latent space)设计丰富多样,不同类型的潜在空间提供了不同的特性以支持多样化的生成和编辑任务。以下是。

文章图片
DDPM, DDIM, LDM 和stable diffusion

综上所述,从DDPM到DDIM,再到LDM,最后到Stable Diffusion,这些模型的发展体现了扩散模型在图像生成领域的不断进步和优化。每一步的发展都在提高生成效率、降低计算成本以及提升图像质量方面做出了贡献。

文章图片
#人工智能#计算机视觉
stable diffusion的attention-map:提取和可视化跨注意力图

项目: 【可视化必备技能(1)】SD / Flux 文生图模型的 Attention Map 可视化-CSDN博客参考:【可视化必备技能(1)】SD / Flux 文生图模型的 Attention Map 可视化-CSDN博客

文章图片
    共 72 条
  • 1
  • 2
  • 3
  • 8
  • 请选择