logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

数字人直播接口开发文档

2. 新手优先用:`select`(启动)、`play_once`(一键播报)、`interrupt`(打断)、`stop`(停止)2. 提交到直播队列:`POST /api/vocals/{vocal_id}/submit`3. 数字人没反应:先查状态`/player/status`,确保是`running`"audio_url": "你的音频在线地址", // 支持mp3/wav。参数:`au

#音视频#语音识别
123数字人api接口

123数字人API接口提供数字人视频合成服务,支持通过音频和视频模板生成播报内容。核心功能包括任务提交(需提供音频URL和可选视频模板)和状态查询,返回视频URL等结果。参数要求包括接口密钥、音频文件(≤90分钟/2G)等,视频需满足≤3GB、mp4/mov格式等技术标准。接口返回结构包含状态码、任务ID和视频地址等信息,适用于虚拟主播、教育等多场景应用。

#个人开发
数字人不限时长安装教程

模型选择与下载:推荐选用开源的无限时长数字人模型(如 SadTalker-lite、D-ID 开源版、ChatTTS+LivePortrait 组合),从 Hugging Face 或 GitHub 下载模型权重(需注意模型许可协议),将权重文件放入本地指定目录。无限时长生成:在界面中上传长文本 / 长音频(无时长限制),模型会自动分帧渲染数字人口型、表情与动作,再通过拼接算法生成完整的长时长数字

#音视频#python#开发语言
4K 超清数字人 API 接口

4K 超清数字人 API 接口(数字人分身短视频训练 API)支持快速训练专属数字人分身形象,可 1:1 复刻真人 4K 超清高保真数字人。接口提供免费使用权限(需实名认证),支持 2K/4K 高清数字人模型生成,适用于短视频制作、虚拟形象打造等场景。video_url是stringhttps://*/1/1.mp4视频 URL 地址,需满足格式及内容要求。若未设置回调 URL,需通过 “数字人训

#人工智能
超清数字人api接口

参数方面,key(接口密钥,必填)、video_url(视频 URL,必填,格式为 mp4/mov,大小 < 5GB,单人脸且无遮挡,面部占比≥1/4,分辨率 360p-4k,时长 5 秒 - 30 分钟)、callbackUrl(自定义回调 URL,选填)。返回参数含code(状态码,200 为正常)、msg(状态信息)、time(时间)、task_id(任务 ID)、model_id(数字人模

文章图片
数字人API接口

以本文研究的接口为例,其核心功能为 数字人形象训练 ,即用户通过上传包含人脸的视频文件,调用后台算法完成面部特征提取、动作建模及语音同步等训练流程,最终生成可交互的数字人模型。| video_url| 是| string| https://*/1/1.mp4| 训练视频的网络地址,需满足MP4/MOV格式、小于5GB、单人脸等技术要求。

#人工智能
文字转语音 API 接口介绍

接口名称:文字转语音 API 标准版,也可称为文本转语音 API 接口、文本转音频接口、文字转音频 API 接口、文字转声音 API 接口、实时文字转语音接口、流式语音合成接口。以下是一个示例,通过 GET 方式请求接口:/api/tts/texttoaudio?“voiceName”:指定想要的语音音色 ID,可根据需求选择不同的音色。示例代码:提供了可供参考的代码示例,帮助开发者快速上手使用接

#语音识别#人工智能
语音转文字 API 接口介绍

接口名称:语音转文本 API 标准版,也可称为语音转文字接口、音频转文本 API 接口、录音转文本 API 接口、链接转文案 API 接口、视频转文字 API 接口、视频音频转文案 API 接口。“audio_url”:必填,类型为 string,示例值如 https://#/#.mp3 ,为音频 url 地址,限 post 请求,支持 mp3、wav、ogg 等音频格式。GET 请求示例:/ap

#语音识别#人工智能
酷虎数字人系统工作原理详细介绍

酷虎数字人系统是一套集成语音处理、AI计算、数字人驱动及流媒体输出的全链路智能系统,核心依托本地知识库、RAG向量知识库、AI大模型、语音服务(ASR/TTs)、数字人模型五大核心模块,通过协同工作将输入信息转化为可实时分发的直播流,最终输出RTMP、FLV、RTC三种主流流媒体格式,适配不同直播、互动场景需求。驱动模块接收AI大模型的指令(文本、语音信号),通过动作捕捉、面部表情驱动算法,实现数

文章图片
#人工智能
酷虎数字人系统工作原理详细介绍

酷虎数字人系统是一套集成语音处理、AI计算、数字人驱动及流媒体输出的全链路智能系统,核心依托本地知识库、RAG向量知识库、AI大模型、语音服务(ASR/TTs)、数字人模型五大核心模块,通过协同工作将输入信息转化为可实时分发的直播流,最终输出RTMP、FLV、RTC三种主流流媒体格式,适配不同直播、互动场景需求。驱动模块接收AI大模型的指令(文本、语音信号),通过动作捕捉、面部表情驱动算法,实现数

文章图片
#人工智能
    共 22 条
  • 1
  • 2
  • 3
  • 请选择