logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

您的车辆正在被识别...

这就是我利用腾讯云api的车辆识别功能来做一个车辆识别工作流的过程,大家在制作的过程中有遇到什么问题,或者有什么想要咨询的欢迎留言,大家一起讨论学习。现实场景中,在大街上遇到一辆不认识的车,总是会被问道,“咦?在线试用没要求签名,但是研究api文档的时候是需要传签名的,我先来看下签名吧。咦,我也没在这里传签名啊,估计腾讯的包里已经封装好了,看来这签名也不用研究。再有别人问你车型的时候,可以将车辆图

文章图片
#AI
dify前端源码部署详细教程

我在这边刚开始时就是填的docker启动的那个ip跟端口,但是一直连不上后端服务,研究半天,后来连上这个服务地址才可以的。我本地原来下载的版本是20.0.0版本的,没关系,咱们再来下载个22版本以上的。注意:不能写docker启动后显示的那个后端地址,要写咱们docker部署的那版的web端连接的后端地址。咱们打开docker部署的那版web端,按F12,随便点几个按钮看下连的哪个地址,填到这里就

文章图片
#python
seamless_communication,facebook推出的开源语音翻译项目

Seamless Communication‌是由Facebook Research开发的一个开源项目,旨在提供先进的语音和文本翻译功能,支持多国语音。

文章图片
#python
实时语音翻译seamless-streaming,支持100多个国家语言

facebook也推出了实时语音翻译系统,支持一百多个国家语音,经实测效果很不错,使用了5G左右显存。

文章图片
#python
语音克隆,数字人必备

下面是原上传音频的内容。支持语气(高兴、悲伤等),多语言,加速慢速,还可将克隆的音频设置成哼唱的。发现一个好用的语音克隆工作流,大家在做数字人视频的时候可以克隆自己的声音,或者别的好听的声音。大家在搭建的过程中有遇到什么问题,或者有什么想实现的功能欢迎留言,大家一起讨论学习。若服务器受网络限制可以先在本地下载好源码,再移到服务器上面安装。2、接着可以去comfyui的manger中安装此插件。上面

文章图片
#python
Xinference详细搭建步骤及如何接入dify

Xinference 是针对生成式 AI 场景度身定制的能力全面的推理服务平台。附官网地址:https://xorbits.cn/

文章图片
#AI#人工智能
dify接入Ollama和Xinference

Xinference 和 Ollama 都是用于本地部署和运行大模型的开源工具,今天来讲下如何本地部署这两个工具。

文章图片
LLaMA-Factory训练自己的大模型

LLaMA Factory 是一个简单易用且高效的大型语言模型(Large Language Model)训练与微调平台。通过 LLaMA Factory,可以在无需编写任何代码的前提下,在本地完成上百种预训练模型的微调。

文章图片
#python
Fooocus 一款好用的文生图软件,4G显存可跑

Fooocus 是一款对标**Midjourney**的图像生成软件,并且可以本地部署,目前star数量已经来到了45.2k,说明非常受大家欢迎的。点击run.bat后如果没有模型文件,会默认下载模型文件,下载完成后自动打开网页。看下效果"a flying gril,Ghibli style"针对不同的显卡,要求的显存不同,20以上的显卡只需4G即可运行。软件还内置了几十种风格,默认勾选了三种风格

文章图片
#python
EchoMimic 阿里开源数字人项目的复现过程

EchoMimic 是一个由阿里巴巴蚂蚁集团开发的开源AI 数字人项目,通过可编辑地标调节实现逼真的音频驱动肖像动画,它能够将静态图像转化为具有动态语音和表情的数字人像。

文章图片
#python
    共 31 条
  • 1
  • 2
  • 3
  • 4
  • 请选择