
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
通过在提示词中多给一些准确案例,实现结果精准推理。比如在以下system_prompt中,多给一些EXAMPLE,出结果。","""

之前的博客已经手敲了一个 Transformer 模型,实际最终训练出来的模型,参数量大概在 1.2 亿左右,文件大小约 505M,在这里我们再来探究一个非常有意思的问题:这个 505M 的文件内部到底存放的是什么?之前的另外一个博客也讲过本地运行过 ChatGLM3-6B,6B 的模型文件分为 8 个,有的版本是 5 个,几个文件加在一起大约 20G,6B 的 130B 模型文件加起来近 240

文本主要介绍利用云端算力,定制化lora生成图片。通过广泛浏览和借鉴多人的文档,借鉴经验,找到的一种最快速最全面的方案。能够完成从lora训练,到模型使用,再到炼丹经验的整个过程。

数据需要定期迁移,数据存在于客户政务外网下,从旧数据库迁移到新数据库中,且要求能够定时增量同步。注意:源数据库所在服务器为windows服务器,目标数据库所在服务器为linux服务器。源数据库所在windows服务器可以连接到目标数据库,但目标数据库无法连接到源数据库。

最近在做视频生成相关的研究,需要一些素材,无意发现了一批开源的视频素材,并且还都提供的有开源下载数据脚本,在这个介绍下,重要的是这些数据应该都是可以在期刊论文发表的,并且获得授权不必担心侵权的,这点还是挺好的,所以在这里说明下,当然,如果大家还有更多的希望也可以发我。

使用google服务器时,给了一台2卡a100gpu linux的debin12系统的服务器,但是上面什么都没有配置,所以需要再重新进行cuda装机,里面涉及到一些服务器自身设备信息的查询和cuda的安装,在这里详细介绍几种方法。

AnimateAnyone是由阿里提出的一项技术,可以实现通过动作视频的驱动,能够令目标图片按照动作视频一样“动起来”。在这里介绍下项目上如何利用各个功能组件,实现这个模型的训练工作,以及发生的问题。

服务器上运行代码会出现这样的问题,比如需要跑大模型这样几个小时或者几天的任务。肯定不可能人一直守着电脑,因为一旦电脑关闭或者网络中中断,服务器和电脑就会断开,一旦连接断开,任务就会中断,导致之前的任务就前功尽弃。所以就提出了nohup的用法,能够使任务直接在服务器上运行,即使任务调也无所谓。文本介绍了相关用法和介绍。

最近在做视频生成相关的研究,需要一些素材,无意发现了一批开源的视频素材,并且还都提供的有开源下载数据脚本,在这个介绍下,重要的是这些数据应该都是可以在期刊论文发表的,并且获得授权不必担心侵权的,这点还是挺好的,所以在这里说明下,当然,如果大家还有更多的希望也可以发我。
