LL94520 个人主页

@LL94520

LL94520

2023-12-09 12:25:37 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

微软Azure语音批量转录人声分离

【摘要】本文记录了作者在调研微软Azure语音转写API(v3.2)人声分离功能时遇到的坑。最初参考中文文档添加参数无效，经过多次尝试发现需要：参数必须嵌套在properties.diarization.speakers结构中需设置minCount和maxCount控制说话人数量范围最终在英文版API文档(v3.2)中找到正确参数格式解决方案：将人声分离参数构造成三层嵌套JSON对象，包含

#microsoft #azure #java +1

到底了