logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

livetalking实时数字人使用turn转发

本文介绍了如何使用TURN转发服务解决GPU服务器UDP端口受限的问题。主要内容包括:1)在云服务器安装coturn服务并配置认证信息、UDP端口范围;2)服务端开放TCP 8010端口运行livetalking应用;3)修改客户端配置使用TURN服务地址。通过这种方式,可在不开放UDP端口的服务器上实现视频转发,每路视频需要2个UDP端口。提供了详细的配置步骤和测试方法。

文章图片
livetalking实时数字人多并发

摘要:文章探讨了实时数字人LiveTalking在多并发场景下的模型推理优化方案,比较了多进程与多线程的优劣。多线程可减少显存占用(共享模型),但可能影响实时帧率;多进程则存在显存线性增长问题。测试数据显示:wav2lip(1.3G显存/750fps)支持30路并发,musetalk(12G显存/60fps)支持2路,ernerf(2G显存/45fps)建议用多进程。针对不同模型特性提供了线程/进

文章图片
livetalking应用场景

Livetalking是一款实时数字人驱动系统,支持WebRTC协议视频流输出。主要功能包括:1)文字实时播报,内置多种TTS服务;2)智能问答,默认集成阿里云Qwen大模型,支持替换为其他模型;3)语音输入播报,可直接上传音频文件或通过WebSocket传输实时音频流。系统提供灵活接口,支持JSON和Form-data数据格式,适用于各类数字人交互场景,用户可根据需求选择内置服务或对接外部AI模

文章图片
#开源
linux cuda环境搭建

在深度学习中经常要用到nvidia显卡,本文介绍linux平台下nvidia显卡驱动和深度学习配套库的安装及常见问题解决

文章图片
#linux#神经网络#dnn
livetalking应用场景

Livetalking是一款实时数字人驱动系统,支持WebRTC协议视频流输出。主要功能包括:1)文字实时播报,内置多种TTS服务;2)智能问答,默认集成阿里云Qwen大模型,支持替换为其他模型;3)语音输入播报,可直接上传音频文件或通过WebSocket传输实时音频流。系统提供灵活接口,支持JSON和Form-data数据格式,适用于各类数字人交互场景,用户可根据需求选择内置服务或对接外部AI模

文章图片
#开源
tensorflow参数分割存储

在tensorflow的分布式训练中,默认将参数以变量名的维度分布式存储在不同ps上。如将item_embedding存储在ps0上,item_bias存储在ps1上。默认不会将同一个变量存储在不同的ps上。在实际情况中,有的变量行数很多,如item_embedding的行数一般有几百万量级,如果存储在同一个ps上,会导致该ps成为性能瓶颈。为了解决以上问题,在tensorflow中可以通过定义p

#tensorflow#深度学习
BimServer安装使用

介绍bimserver的安装及安装中遇到的问题解决,讲解怎么导入工程文件到bimserver中并能在线浏览3d模型

docker打包介绍

最近在做一个开源项目,遇到开发者问各种问题,发现都是系统和软件版本的差异引起的。于是了解了一下docker的使用,发现docker真是个好东东,基本解决了各种版本差异的问题,真正做到了一键部署使用。先熟悉一下docker里的概念,docker分为镜像和容器,镜像是一个静态的文件,用于分发部署。容器是镜像运行起来后的运行时对象,可以在容器里安装软件、添加文件等,修改后可以用docker commit

文章图片
#docker#容器#运维
基于live555实现rtsp视频直播

email:lipku@foxmail.com现有的安防监控设备视频传输都是用的各家私有协议,鲜有用标准协议rtsp的。如果能用rtsp来传输,那很多标准的rtsp客户端都能连上观看,真正做到互联互通。Live555是目前实现rtsp协议最短小精悍的开源代码,能很方便的移植到各种嵌入式系统中,而且该开源项目更新速度很快,基本每个月都有更新版本。Live555目前已经实现了基于udp和tcp的传

#嵌入式#服务器
到底了