logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

保姆级零基础微调大模型(LLaMa-Factory,多卡版)_llamafactory多卡训练

第一次尝试多卡微调大模型中途遇到了挺多坑,并且感觉有一些思维上的误区,要及时记录下来:1. 使用unsloth训练只能用单卡2. 配置文件一定要好好看,每个都看懂,比如说yaml文件,有一些配置默认的要改成合适的,在微调的时候就要多点去了解每个参数的含义3. 报错第一时间去看issue,而不是在网上乱搜4. 要尽量使用2的次方的卡数,比方说2,4,8,用其他的不符合操作系统的规律,可能会有一些问题

#AIGC
语音识别神器 Whisper 的几个小技巧_如何设定whisper只输出中文

OpenAI开源的免费离线语音识别神器Whisper,我在安装使用后发现一些问题,于是搜了半天最终汇总了这几个主要的小技巧,希望对大家有帮助,不用满世界再搜了。系统:Ubuntu22.04具体怎么正常使用或者怎么安装,官方MD很详细了,不行再搜搜也就有了,我就没记录。综述所述,最后就固定一个prompt的写法,就能解决这俩问题。以下是普通话的句子,这是一段会议记录。如果想输出繁体字,上面内容就全用

文章图片
#百度#媒体#AIGC +2
文生图大模型三部曲:DDPM、LDM、SD 详细讲解!_文生图大模型有哪些

值得注意的是,这里的tokenizer最大长度为77(CLIP训练时所采用的设置),当输入text的tokens数量超过77后,将进行截断,如果不足则进行paddings,这样将保证无论输入任何长度的文本(甚至是空文本)都得到77x768大小的特征。Latent Diffusion Models(潜在扩散模型,LDM)通过在一个潜在表示空间中迭代“去噪”数据来生成图像,然后将表示结果解码为完整的图

文章图片
#人工智能#计算机视觉#深度学习 +1
比肩Midjourney-v6!没有GPU也能跑可图Kolors_comfyui 可图

其次,可图采用的ChatGLM3代替了传统的CLIP模型做文本提示词嵌入,语义能力增强的同时显存消耗也从原来的几百MB变成十几G,这样,本地显存少于20G的用户,需要用有损量化或者损失推理速度的办法运行可图。7月6日,快手宣布开源数十亿参数的文生图模型可图Kolors,可图支持中英文双语,支持长达256 token的上下文长度,最重要的是可以渲染中文,生成效果上实现了质的飞跃。国产文生图模型的强势

#AIGC
使用LLaMA-Factory微调大模型_llamafactory lora 合并

但是占用显存较多,显存是缓慢上升的过程,到二十多步的时候就开始爆了。启用webui共有两种方式,一种是直接启动,一种是通过docker启动。使用的GPU 第一块卡,刚开始的时候 批处理设置的太大,容易造成显卡内存溢出,根据自己的实际情况设置。接下来又问了一句”鲁迅可以打周树人吗“,回答是没有问题,就是速度慢了点,右边还有很多的参数可以调整。③使用stage=3的时候,每step 40s,刚开始使用

文章图片
#java#c++#算法 +1
机器人运动学笔记

SDH和MDH会不一样,主要的区别在于SDH中坐标系在连杆末端,MDH中坐标系在连杆首端。虽然这里只是给出z轴,但是由于后面原点位置不同,所以二者z轴也不同。

文章图片
#机器人
stable diffusion多显卡堆积

通过利用多显卡堆积,您可以显著提高Stable Diffusion的性能,加速绘图和其他计算任务。这个简单的设置可以让您更高效地进行创作和实验,将Stable Diffusion的潜力充分发挥出来。希望这篇文章对您有所帮助,让您更好地利用这一强大工具。如果您有任何问题或疑问,请随时与我们联系,我们将尽力提供帮助。愿您在Stable Diffusion的创作中取得出色的成就!

文章图片
#人工智能#深度学习
本地部署Whisper Web结合内网穿透实现远程访问本地语音转文本模型_群晖 本地部署whisper

OpenAI开源的 Whisper 语音转文本模型效果都说还不错,今天就给大家推荐 GitHub 上一个开源项目 Whisper Web,允许你可直接在浏览器中运行使用 Whisper。基于 ML 进行语音识别,并可通过 WebGPU 进行运行加速,无需后端服务器,直接开箱即用。另外,识别到的文本支持导出 TXT 和 JSON 两种文件格式。而结合cpolar内网穿透工具。

文章图片
#人工智能#AIGC
Ai绘画工具Stable Diffusion,最全提示词使用指南!建议收藏!_stable diffusion的加号

1、提示词通常是在文生图和图生图的时候会使用到,就是这里的两个功能。2、提示词由多个描述性词汇组成,由逗号隔开,结尾不需要加分隔符(注:一般都是英文词汇和英文逗号)例如:1girl,long hair,white hair表示我们想生成一个长发且头发是白色的女孩。3、提示词分为正向提示词(positive prompt)和反向提示词(negative prompt),用来告诉AI我们想要生成什么和

文章图片
#pytorch#人工智能#AIGC
全网最详细的 Midjourney教程:品牌 Logo生成_midjourney生成logo

正如我 Midjourney 教程前面提到的那样,Midjourney 跟 ChatGPT 不一样,ChatGPT 是声明式的,你甚至可以让它扮演某个角色,但 Midjourney 是指令式的,你只能用指令然它画出你想象中的图片。另一个常见玩法就是渐变色,如果你用的是电脑的浏览器是 Edge,可以去看看它的 Logo,它的 Logo 就是一个渐变色,然后是个浪的外观。坦率地说,在我学习如何使用 M

文章图片
#人工智能#AIGC
    共 344 条
  • 1
  • 2
  • 3
  • 35
  • 请选择