
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
摘要:希尔贝壳联合多家机构发布了首个大规模多维标注的川渝方言语音语料库WenetSpeech-Chuan,包含10000小时语音数据和丰富标注信息。针对川渝方言语音识别(ASR)和语音合成(TTS)研究面临的标注资源匮乏问题,团队提出了完整的Chuan-Pipeline处理框架,采用LLM-GER转录技术提升方言识别准确率。同时发布的WSC-Eval评测基准包含ASR和TTS测试集,实验证明基于该

这样,不仅视频内容非常符合用户意图,还能拓展在虚拟环境、交互式应用和沉浸式体验中的应用场景,可以用在3D游戏场景中快速可控建模,以及在具身智能中快速搭建模拟场景。而用户在场景中运动时,3D场景生成大模型就会不断对场景缺失区域进行几何和纹理的补全,因此用户无论在任何位置、任何角度,都能看到合理、一致的场景。从生成的视频中不难看出,Matrix-Zero自由探索的范围任意大,任意广。我们还需要做的是,

摘要:WenetSpeech-Chuan是首个大规模多维标注的川渝方言语音语料库,包含10,000小时来自9大领域的语音数据,并配有ASR转录、说话人属性、情感等多维度标注。针对川渝方言语音技术发展受限的问题,研究团队提出完整的Chuan-Pipeline处理框架,创新性地采用LLM-GER转录方法提升方言识别准确率15%。实验表明,基于该数据集训练的模型在ASR和TTS任务中性能超越现有SOTA

大语言模型(LLMs)和人工智能生成内容(AIGC)的快速发展加速了AI原生应用的出现,例如基于AI的故事书,它们能够自动生成吸引儿童的故事内容。这些挑战源于GUI环境的动态性和结构化特性,包括文本、图像及空间关系的融合,以及不同页面和任务间操作空间的变动性。朱梓臣,汤浩,李妍思,刘丁烨,许洪深,兰焜耀,张丹阳,姜懿轩,周浩,王辰润,张思拓,孙良泰,王熠笑,孙羽恒,陈露,俞凯。徐薛楠,梅嘉豪,李晨
点云编码器将点云信息编码为紧凑的特征表示,随后由大语言模型(LLM)生成描述场景的场景代码(scene codes),这些场景代码可以被进一步转换为三维结构布局。SpatialLM 是一款专门为三维空间理解设计的大语言模型,通过三维点云数据,生成结构化的三维场景理解输出,包括墙壁、门、窗等建筑元素,以及带有语义类别的定向物体边界框。点云数据(Point Cloud)是一种由大量空间点组成的数据集合

近期,昆山杜克大学在语音旗舰期刊IEEE/ACM Transactions on Audio, Speech and Language Processing (TASLP) 上发表了一篇题为“Online Neural Speaker Diarization with Target Speaker Tracking”的论文。论文探索了利用特定人声纹提取和语音活动检测来进行在线说话人日志任务。

AISHELL-5作为首个开源的真实车载多通道中文语音识别数据集,填补了智能驾舱语音交互研究领域的数据空白。该数据集包含893.7小时真实车内录音(含706小时对话和187小时噪声),采集自165名说话人在60多个车载场景下的多方位麦克风信号。由希尔贝壳联合理想汽车等机构发布的该项研究入选INTERSPEECH2025会议,配套开源基线系统展示了主流ASR模型在复杂驾舱环境中的性能挑战。数据集下载

我们报告了一项全面的基准测试,揭示了当前ASR系统的最新技术全景,涵盖多个开源模型与商业服务;我们量化了评分流程中不同细微差异对最终基准结果的影响,包括大写、标点、感叹词、缩略形式、同义词使用、复合词等问题,这些因素在端到端ASR系统转型背景下显得尤为重要;受Kolmogorov复杂度和归一化信息距离(NID)的启发,我们提出并讨论了对传统字/词Token错误率(TER)指标的改进型修正——mTE
摘要:希尔贝壳联合多家机构发布了首个大规模多维标注的川渝方言语音语料库WenetSpeech-Chuan,包含10000小时语音数据和丰富标注信息。针对川渝方言语音识别(ASR)和语音合成(TTS)研究面临的标注资源匮乏问题,团队提出了完整的Chuan-Pipeline处理框架,采用LLM-GER转录技术提升方言识别准确率。同时发布的WSC-Eval评测基准包含ASR和TTS测试集,实验证明基于该

9月25日,中国信通院举办的“2023大模型工程化论坛”在北京召开,来自研究院云计算与大数据研究所人工智能部的曹峰主任在论坛上宣布了AI4SE(AI for Software Engineering)工作组首批成员,此次名单包括了高校、研究机构、金融行业、运营商、大型互联网公司、软件服务商等共计65家单位,希尔贝壳为AI4SE工作组首批成员单位之一。








