作为一名CV,对AI快速崛起我无比兴奋,Google近期开源了一些模型,包括大神写的一些初级应用,着实体验了一把AI的强大,其中包含 抠图、tts语音、视频去背景、照片转换场景、图片快速合成等等,以下我以学习 PhotoMaker 为例说明一下:

环境:Windows10 + idea(Python3.8) + NVIDIA GeForce MX330(2G垃圾的很)

PhotoMaker:推荐GPU 15G   且  torch_dtype = torch.float16 为最佳,垃圾的电脑因为这个会报错,下面讲。

1.代码拉取:GitHub - bmaltais/PhotoMaker at v1.0.1

2.开发环境待建

2.1.手动不详述

2.2.脚本 命令行执行 > gui.bat

3.运行

3.1. 命令行执行 >   python gradio_demo/app.py

3.2.垃圾电脑:上传图片执行会报错:RuntimeError: "LayerNormKernelImpl" not implemented for 'Half'

这是因为电脑的GPU配置太差,要想不报错需要修改一行代码,如下:

然并卵,图片太大会报错 oom。建议大家用游戏本跑或者 Linux环境,且GPU至少 15G

Logo

瓜分20万奖金 获得内推名额 丰厚实物奖励 易参与易上手

更多推荐