logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【AI对话系统新挑战】FutureDial-RAG Challenge详解

检索增强生成技术,通过结合检索和生成能力,能够从外部知识库中检索相关信息,从而提高文本生成的准确性和多样性,减少事实错误,并提高文本的可信度和准确性。对于两个赛道,赛事组织者搭建了如上的基线系统。为了进一步推动在对话系统构建中利用RAG技术的研究,赛事组织者发布了中英文双语对话数据集MobileCS2,并组织了包括两个赛道的挑战赛:基于知识库和对话上下文的信息检索(赛道1)以及对话系统中的检索增强

文章图片
#人工智能
开源SHTNet:基于球谐变换的轻量鲁棒多通道语音识别

新疆大学与清华大学团队提出SHTNet语音识别框架,通过球谐变换实现阵列几何解耦,显著提升多通道语音识别的鲁棒性。该框架包含球谐编码器、空间-频谱注意力融合网络和Rand-SHT训练策略,在AISHELL-4等数据集测试中展现优异性能:CER更低、计算量减少97.1%、跨阵列稳定性强(8通道降至2通道仅降2.32%),流式识别延迟仅15.5ms。研究成果发表于INTERSPEECH2025,代码已

文章图片
#语音识别#人工智能
到底了