logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

杭州六小龙最新开源「空间理解模型」,保姆级教程来了!

点云编码器将点云信息编码为紧凑的特征表示,随后由大语言模型(LLM)生成描述场景的场景代码(scene codes),这些场景代码可以被进一步转换为三维结构布局。SpatialLM 是一款专门为三维空间理解设计的大语言模型,通过三维点云数据,生成结构化的三维场景理解输出,包括墙壁、门、窗等建筑元素,以及带有语义类别的定向物体边界框。点云数据(Point Cloud)是一种由大量空间点组成的数据集合

文章图片
#人工智能#深度学习
IEEE T-ASLP | 基于特定人跟踪的在线说话人日志研究

近期,昆山杜克大学在语音旗舰期刊IEEE/ACM Transactions on Audio, Speech and Language Processing (TASLP) 上发表了一篇题为“Online Neural Speaker Diarization with Target Speaker Tracking”的论文。论文探索了利用特定人声纹提取和语音活动检测来进行在线说话人日志任务。

文章图片
#语音识别
AISHELL-5 全球首套智能驾舱中文语音交互数据集开源

AISHELL-5作为首个开源的真实车载多通道中文语音识别数据集,填补了智能驾舱语音交互研究领域的数据空白。该数据集包含893.7小时真实车内录音(含706小时对话和187小时噪声),采集自165名说话人在60多个车载场景下的多方位麦克风信号。由希尔贝壳联合理想汽车等机构发布的该项研究入选INTERSPEECH2025会议,配套开源基线系统展示了主流ASR模型在复杂驾舱环境中的性能挑战。数据集下载

文章图片
#交互
SpeechColab排行榜:一个开源的语音识别评测平台

我们报告了一项全面的基准测试,揭示了当前ASR系统的最新技术全景,涵盖多个开源模型与商业服务;我们量化了评分流程中不同细微差异对最终基准结果的影响,包括大写、标点、感叹词、缩略形式、同义词使用、复合词等问题,这些因素在端到端ASR系统转型背景下显得尤为重要;受Kolmogorov复杂度和归一化信息距离(NID)的启发,我们提出并讨论了对传统字/词Token错误率(TER)指标的改进型修正——mTE

#人工智能#大数据#语言模型 +1
WenetSpeech-Chuan:多维标注大规模四川话语音语料库开源

摘要:希尔贝壳联合多家机构发布了首个大规模多维标注的川渝方言语音语料库WenetSpeech-Chuan,包含10000小时语音数据和丰富标注信息。针对川渝方言语音识别(ASR)和语音合成(TTS)研究面临的标注资源匮乏问题,团队提出了完整的Chuan-Pipeline处理框架,采用LLM-GER转录技术提升方言识别准确率。同时发布的WSC-Eval评测基准包含ASR和TTS测试集,实验证明基于该

文章图片
#人工智能#大数据
希尔贝壳入选中国信通院AI4SE工作组首批成员单位!

9月25日,中国信通院举办的“2023大模型工程化论坛”在北京召开,来自研究院云计算与大数据研究所人工智能部的曹峰主任在论坛上宣布了AI4SE(AI for Software Engineering)工作组首批成员,此次名单包括了高校、研究机构、金融行业、运营商、大型互联网公司、软件服务商等共计65家单位,希尔贝壳为AI4SE工作组首批成员单位之一。

文章图片
#人工智能
超越Devin!姚班带队,他们创大模型编程新世界纪录

SWEBench排行榜上迎来了新玩家——,姚班带队初创公司OpenCSG出品,以23.67%的成绩获得全球第二名的成绩。同时创造了(SOTA)。我们都知道,SWEBench评测高度贴近真实编程场景,难度极高,不仅要求模型能理解需求、协调多个函数/类甚至文件的变更,还要求模型与执行环境交互,处理超长上下文并执行远超传统代码生成任务的复杂逻辑推理。在这种高难度的真实测试中,行业中最先进的GPT4和De

文章图片
#人工智能#深度学习#语言模型
文字转语音、语音转文字! AI视频生成神器!

分享一波文字转语音、语音转文字!AI视频生成神器!让外国人说中文,口型自然,不限语言,感兴趣的同学可以试试~

文章图片
#人工智能
上交大与上海人工智能研究所联合推出医学多语言模型,模型数据代码开源

今天为大家介绍的是来自上海交通大学的王延峰与谢伟迪团队的一篇论文。开源的多语言医学语言模型的发展可以惠及来自不同地区、语言多样化的广泛受众。来源丨 DrugAI、 机器人的脑电波。

文章图片
#人工智能#语言模型#自然语言处理
加快建设人工智能高质量数据集

面向重点场景,打造数据技术“测试场”,提供真实数据环境、模拟应用场景,建设中试基地,吸引企业、高校和科研机构参与数据技术的创新和验证,加速新技术推广和应用。面向医疗、教育、科研、法律、工业、农业、物流、金融、能源、交通等重点领域建设大数据中心及大模型行业应用创新(工程)中心,打破信息孤岛,构建完备数据生态,构建高质量数据集,提升垂直领域人工智能模型能力。面向新一代人工智能技术开发和应用发展需求,完

文章图片
#DeepSeek#人工智能#阿里云
    共 36 条
  • 1
  • 2
  • 3
  • 4
  • 请选择