logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

大语言模型复现常见bug及解决方法

开源AI绘画扛把子,Stable Diffusion背后公司StabilityAI再放大招!全新开源模型DeepFloyd IF,一下获星2千+并登上GitHub热门榜。DeepFloyd IF仍然基于扩散模型,但与之前的Stable Diffusion相比有两大不同。负责理解文字的部分从OpenAI的CLIP换成了谷歌T5-XXL,结合超分辨率模块中额外的注意力层,获得更准确的文本理解。负责生成

文章图片
#语言模型#bug#人工智能
obsidian使用开源的omnivore快速保存微信公众号文章到obsidian中

本方法适用于任何网页的文章以markdown格式保存到obsidian中

文章图片
#编辑器
RuntimeError: Expected to have finished reduction in the prior iteration before starting a new one.

启用 find_unused_parameters: 确保在 accelerate 的 Accelerator 初始化中使用了 find_unused_parameters 参数。设置调试信息环境变量: 通过设置 TORCH_DISTRIBUTED_DEBUG 环境变量为 INFO 或 DETAIL,获取关于哪些参数没有接收到梯度的详细信息。实例化 Accelerator: 使用 accelera

文章图片
#pytorch#深度学习#人工智能
accelerate设置单GPU

【代码】accelerate设置单GPU。

文章图片
#深度学习#人工智能
到底了