logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

如何使用ModelScope训练自有的远场语音唤醒模型?

本文介绍魔搭社区中远场语音增强与唤醒一体化的语音唤醒模型的构成、体验方式,以及如何基于开发者自有数据进行模型的定制。

文章图片
#语音识别#人工智能
INTERSPEECH 2022——基于层级上下文语义信息的多尺度语音合成风格建模

本文由清华大学与虎牙信息科技有限公司、元象唯思控股(深圳)有限公司和香港中文大学合作。 人类语音的风格表达是多尺度的,不仅包括全局尺度的情感表达,还包括局部尺度的韵律表达。 而现有关于表现力语音合成的工作只考虑了单一尺度的说话风格。

文章图片
#人工智能#深度学习
竞赛获奖系统解读:远场说话人确认中基于两阶段迁移学习解决域不匹配问题

作为Interspeech2022的赛事活动,远场说话人验证挑战赛 (FFSVC) 由昆山杜克大学、新加坡国立大学、南加州大学和希尔贝壳联合组织,主要关注极具挑战性的远场说话人确认任务。2020年举办的第一届FFSVC赛事主要关注多通道跨域说话人确认问题 [1]。今年第二届FFSVC赛事[2]考察单通道说话人确认的跨域问题,具体分为两个赛道,赛道一主要关注完全监督的说话人确认,其中允许使用VoxC

文章图片
ICASSP 2023说话人识别方向论文合集(一)

ICASSP (International Conference on Acoustics, Speech and Signal Processing) 即国际声学、语音与信号处理会议,是IEEE主办的全世界最大、最全面的信号处理及其应用方面的顶级会议,在国际上享有盛誉并具有广泛的学术影响力。

文章图片
#人工智能#语音识别
巧用语言模型——让准确率再涨一点点!

本篇文章将分别介绍 CTC 和 RNN-T 两种模型上的语言模型使用方法,大家可以挑选适合自己的方法使用~

文章图片
#语言模型#自然语言处理#深度学习
语音之家SOTA | 开源发布:SPEECHIO_ASR_ZH00002 鲁豫有约

数据集可直接在 leaderboard 中使用,方便SpeechIO 的读者以及厂商复现、核对评测结果,欢迎合理的修改建议和 Pull Request。SPEECHIO_ASR_ZH00000 :Leaderboard 调试集(经济、货币、金融)分发采用了商用的阿里云对象存储服务,大量的数据分发会对 SpeechIO 产生高额流量费用。格式1 metadata.tsv:包括音频路径,音频长度,文本

文章图片
#开源#语音识别#人工智能
竞赛获奖系统解读:VPC2022语音隐私保护赛NWPU-ASLP说话人匿名化系统

平均说话人向量是为了保证来自特定说话人的每条语音由相同的伪说话人产生,而来自不同说话人的语音由不同的伪说话人产生。我们提出的方法使用说话人编码器生成的两种说话人向量加权得到,一种是由保留的伪说话人ID生成的伪说话人向量,可以确保匿名结果不对应于任何真实说话人;在本届VPC竞赛中,我们的系统分别达到了30.15%和5.82%的最佳平均EER和WER,在竞赛设定的四个条件上均取得了最好成绩,这表明我们

文章图片
#人工智能#语音识别
论文分享|AAAI2024 基于异构图上下文建模实现对话语音合成的情感渲染

本次分享内蒙古大学S2LAB与字节跳动、港中文(深圳)合作,关于情感对话语音合成的工作《Emotion Rendering for Conversational Speech Synthesis with Heterogeneous Graph-Based Context Modeling 》。该工作利用异构图实现情感上下文建模机制,生成符合对话语境的情感语音,实现了对话语音合成的情感渲染。该工作

文章图片
#人工智能#语言模型#语音识别
第十七届全国人机语音通讯学术会议(NCMMSC 2022) | 早鸟票开放注册了

2022年第十七届全国人机语音通讯学术会议(National Conference on Man-Machine Speech Communication, NCMMSC 2022)将于2022年12月15~18日在安徽合肥举行。

文章图片
#人工智能#语音识别
【语音之家】AI产业沙龙—火山语音在AI视频译制方向的技术探索与实践

由CCF语音对话与听觉专委会 、中国人工智能产业发展联盟(AIIA)评估组、火山语音、语音之家、希尔贝壳共同主办的【语音之家】AI产业沙龙—火山语音在AI视频译制方向的技术探索与实践,将于2022年11月1日19:00-20:45线上直播。

文章图片
#人工智能
    共 221 条
  • 1
  • 2
  • 3
  • 23
  • 请选择