个人主页

@weixin_47748259

2023-04-01 23:49:07 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

Stable Diffusion（SD）核心基础知识——（文生图、图生图）

Stable Diffusion是计算机视觉领域的一个生成式大模型，可以用于文生图，图生图，图像inpainting，ControlNet控制生成，图像超分等丰富的任务。

#人工智能 #AIGC #深度学习

huggingface学习|用dreambooth和lora对stable diffusion模型进行微调

新建一个python文件（如取名为train），保存以下代码，将对应的模型路径、prompt内容和图片名进行修改即可。新建一个python文件（如取名为train），保存以下代码，将对应的模型路径、prompt内容和图片名进行修改即可。–pretrained_model_name_or_path：Hub 上模型的名称或预训练模型的本地路径。–instance_data_dir：包含训练数据集的文件

#算法 #人工智能 #AIGC

【论文精读】DALLE3：Improving Image Generation with Better Captions 通过更好的文本标注改进图像生成

由于用户在实际应用过程中，可能不会发出长的、高度描述性的标注的分布，因此可以借助大型语言模型帮助用户直接扩写，具体来说，可以使用 LLM进行“上采样”，将短的prompt转换成长的prompt，这样不仅可以添加缺失的细节，还可以消除复杂关系的歧义。实验进行到一半时，评估显示 65% 的混合物在所有评估中都远远落后于其他混合物，因此作者放弃了它。作者使用95%的合成标注和5%的真实标注对DALLE3

#算法 #深度学习 #AIGC +1

DreamBooth：个性化的文本到图像扩散模型

DreamBooth是一种微调文生图扩散模型的方法，最大的特点是Subject-Driven，针对某一个特定的主体，生成在不同的场景、姿势和视角中的该主体上下文图像；DreamBooth的两个主要贡献是:主题驱动生成。给定一些随意捕获的主题图像，目标是在不同的背景下合成主题的新颖再现，同时保持其关键视觉特征的高保真度。用于在少量镜头设置中微调文本到图像的扩散模型，同时保留模型在主题类上的语义知识。

#计算机视觉 #人工智能 #算法 +1

huggingface学习|云服务器部署Grounded-Segment-Anything：bug总会一个一个一个一个又一个的解决的

模型下载到Grounded-Segment-Anything目录中，然后修改grounded_sam_inpainting_demo.py中的代码，具体修改方式是将下图中第204行-206行被注释掉的代码修改为207行-209行的代码。按下a键后进入insert模式（进入insert模式后才能对文件内容进行修改），然后在该界面的最后几行复制粘贴以下代码，其中path就是之前设置的gcc-9.4.0

#AIGC #人工智能 #算法 +2

【论文精读】DALLE2: Hierarchical Text-Conditional Image Generation with CLIP Latents

DALLE2是可以根据文本描述去生成这种原创性的真实的图片，DALLE2学习了图片文本中的特征，可以任意的组合这些概念、属性、风格。DALLE2也可以根据文本对已有的图片进行编辑和修改，可以任意添加或者移除现在图片里的物品，甚至可以把阴影、光的反射、物体的纹理全部考虑在内。对比学习的方法比如CLIP模型已经可以学习到很稳健的图像特征，不仅能捕获到语义信息，还能捕获到图像的风格信息。（可以考虑用这些

#深度学习 #人工智能 #算法 +1

深度学习代码|MSE损失的代码实现

一般在反向传播时，都是先求loss，再使用loss.backward()求loss对每个参数 w_ij和b的偏导数(也可以理解为梯度)。但是只有标量才能执行backward()函数，因此在反向传播中reduction不能设为"none"。NumPy 是 Python 语言的一个第三方库，支持大量高维度数组与矩阵运算。此外，NumPy 也针对数组运算提供大量的数学函数。机器学习涉及到大量对数组的变换

#深度学习 #人工智能 #算法 +1

常见优化器对比：梯度下降法、带动量的梯度下降法、Adagrad、RMSProp、Adam

优化器｜SGD ｜Momentum ｜Adagrad ｜RMSProp ｜Adam。

#深度学习 #算法 #神经网络

归一化总结：BN、LN、IN、GN、SN

在机器学习领域中，不同评价指标（即一组特征中的不同特征就是所述的不同评价指标）往往具有不同的量纲和量纲单位，这样的情况会影响到数据分析的结果，为了消除指标之间的量纲影响，需要进行数据标准化处理，以解决数据指标之间的可比性。即，原始数据经过数据标准化处理后，各指标处于同一数量级，适合进行综合对比评价。数据归一化一般有[0,1]归一化和正态分布归一化两种方法：[0,1]归一化：使结果值映射到[0，1]

#算法 #深度学习

凸优化理论学习一|最优化及凸集的基本概念

线性分数函数是仿射映射函数和透视变换的复合函数，依然还是保凸运算，凸集在线性分数函数下的像和逆像都是凸的。支撑超平面不完全逆定理：如果一个集合是闭的，具有非空内部并且其边界上每个点均存在支撑超平面，那么它是凸的。仿射映射：凸集的仿射映射也是凸的。（函数形式为f=Ax+b，则称函数是仿射的，即线性函数加常数的形式。是有限多个线性不等式和等式的解集，也是有限数量的半空间和超平面的交集。支撑超平面：如果

#学习

共 37 条

请选择