logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

微软Azure语音批量转录人声分离

【摘要】本文记录了作者在调研微软Azure语音转写API(v3.2)人声分离功能时遇到的坑。最初参考中文文档添加参数无效,经过多次尝试发现需要: 参数必须嵌套在properties.diarization.speakers结构中 需设置minCount和maxCount控制说话人数量范围 最终在英文版API文档(v3.2)中找到正确参数格式 解决方案:将人声分离参数构造成三层嵌套JSON对象,包含

文章图片
#microsoft#azure#java +1
到底了