logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Stable Diffusion搭建全过程记录,生成自己的专属艺术照

项目开发领导者有两位,分别是 AI 视频剪辑技术创业公司 Runway 的 Patrick Esser,和慕尼黑大学机器视觉学习组的 Robin Romabach。这个项目的技术基础主要来自于这两位开发者之前在计算机视觉大会 CVPR22 上合作发表的潜伏扩散模型 (Latent Diffusion Model) 研究。在训练方面,模型采用了4000台 A100 显卡集群,用了一个月时间。

文章图片
#人工智能#深度学习#计算机视觉
leetcode刷题总结(四)

2019/9/2:盛最多水的容器与三数之和题目一链接:盛最多水的容器题目二链接:三数之和这两题的思想都是用双指针找到最大值或者是最合适的值,加深了我对指针的概念,另外我确实需要反复看这两题:题一可以这么理解:由于面积取决于边长短的那一端假设为m,所以要想得到比当前更大的面积,边长短的那一端必须舍弃,因为如果不舍弃,高最大就是m,而随着指针的移动宽会一直减小,因此面积只会越来越小。完整的...

sora笔记(三):diffusion transformer模型的发展历程

::info💡在一文中介绍了目前未开源的sora模型可能涉及到的技术点,包括介绍了Vision Transformer,作为transformer正式用于图像的一种范式,为本文中将提到的内容打下基础,同时一文对diffusion model的数学原理推导,也为后来模型的演化提供更加完整的认识。而本文将要介绍的是后来的ViViT与DiT两种模型架构,并对其进行了更进一步的源码分析。

文章图片
#transformer#深度学习
docker学习笔记(9):nvidia-docker安装、部署与使用

引言NVIDIA深度学习GPU训练系统(又名DIGITS)是用于训练深度学习模型的Web应用程序。它将深度学习的力量交到了工程师和数据科学家手中。它可用于快速训练用于图像分类,分割和目标检测任务的高精度深度神经网络(DNN)。当前受支持的框架为:Caffe,Torch和Tensorflow。nvidia-docker部署使用前置环境首先是需要cuda以及cuda对应的gcc、g+等依赖,目前19年

#docker#centos#linux +1
数学二高数公式总结

本篇因为是考试后写的,虽然保不准也算下一次考试前,创作初衷也就今天突然想总结一下之前一直在用的公式,周期可能也就这两天,但参考了一些别人的博文或者帖子,觉得还是与自己想的侧重点有点不太一样,所以就有了上面这张思维导图的大纲,如果不太完整的地方,后期我会去尽量完善,本篇公式有些图是我自己做的,有些是参考文献中引用的几篇知乎帖子,考虑到公式美观性,与参考文献也没有对公式加上水印,所以本篇大部分图片都去

文章图片
数学二高数公式总结

本篇因为是考试后写的,虽然保不准也算下一次考试前,创作初衷也就今天突然想总结一下之前一直在用的公式,周期可能也就这两天,但参考了一些别人的博文或者帖子,觉得还是与自己想的侧重点有点不太一样,所以就有了上面这张思维导图的大纲,如果不太完整的地方,后期我会去尽量完善,本篇公式有些图是我自己做的,有些是参考文献中引用的几篇知乎帖子,考虑到公式美观性,与参考文献也没有对公式加上水印,所以本篇大部分图片都去

文章图片
Stable Diffusion搭建全过程记录,生成自己的专属艺术照

项目开发领导者有两位,分别是 AI 视频剪辑技术创业公司 Runway 的 Patrick Esser,和慕尼黑大学机器视觉学习组的 Robin Romabach。这个项目的技术基础主要来自于这两位开发者之前在计算机视觉大会 CVPR22 上合作发表的潜伏扩散模型 (Latent Diffusion Model) 研究。在训练方面,模型采用了4000台 A100 显卡集群,用了一个月时间。

文章图片
#人工智能#深度学习#计算机视觉
到底了