数据堂官方账号个人主页

@weixin_44532659

数据堂官方账号

2023-04-21 18:10:33 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

数据竞赛 | 第二届多语种对话语音语言模型（MLC-SLM）挑战赛正式开启

近年来，大语言模型的快速发展推动了语音大语言模型的进步，使得语音识别与理解能够实现统一建模。然而，该领域的发展在很大程度上依赖于高质量的真实世界多语言对话语音数据，这类数据能够真实反映人类自然交流的复杂性，是推动语音大语言模型向更深层次发展的核心支撑。。

#语言模型 #人工智能 #自然语言处理

说话人识别声纹语音数据库CN-Celeb

分享：CN-Celeb 是由清华大学语音和语言技术中心（CSLT）近日公布的一个中国明星声纹库。该声纹库包含1,000名中国明星（包括歌星、影星、说唱艺人等）在采访、歌舞及影视作品中的声音片段。每位明星的声音时长大约20分钟，整个数据集近300小时。该数据包含了11类实际场景，覆盖了噪音、信道、发音方式等各方面的复杂性，特别适合研究复杂场景下的说话人识别技术。研究者可在共享资源网站 http:/.

#机器学习 #深度学习 #人工智能

特斯拉OpenAI数据路线遇挫！8千平具身「兵工厂」+ego众包狂飙

2026年，不是人形机器人的量产元年，而是具身智能数据元年。硬件决定机器人的下限，而数据决定机器人的上限。这场Physical AI竞赛的核心，是数据闭环工程能力。以数据堂为代表的服务商，正用双轮体系为具身智能输送燃料，搭建实验室与产业落地的桥梁。未来，机器人的差距，本质上是数据的差距。而那些能掌握分层采集、数据闭环与标准体系的企业，终将主导下一代Physical AI的发展——因为，数据正在重新

#人工智能

特斯拉OpenAI数据路线遇挫！8千平具身「兵工厂」+ego众包狂飙

#人工智能

具身智能的下一步：如何构建跨场景通用训练数据集？

在自动驾驶、智能家居、医疗陪护、工业自动化等领域，具身智能正在颠覆传统模式。然而，具身智能“大脑”的训练高度依赖于从真实物理环境中获取的多模态交互数据。如何解决物理世界数据匮乏问题，已成为当前具身智能技术演进过程中亟待突破的关键瓶颈。

#人工智能

【ECCV 2022】76小时动捕，最大规模数字人多模态数据集开源

由于数据量，数据标注的缺乏和数据质量的限制，现有的算法很难生成个性化，高手部质量，情感相关，动作 - 语义相关的动作。在 BEAT 数据集中，对于动作给出了基于动作类别分类的相关度分数，共分为四类 10 档：beat（1），deictic （2-4）， icnoic（5-7），metaphoic（8-10）。BEAT 包含四种语言的数据：英语，中文，西班牙语，日语，数据量分别为 60，12，2，2

#人工智能

平台亮点 | 数据堂位姿标注工具：助力具身智能理解真实世界

当具身智能机器人试图抓取桌面的水杯时，它面临着一个根本性的技术挑战：如何通过摄像头采集的点云数据，准确理解水杯在三维空间中的具体位置和姿态？这就是位姿估计要解决的核心问题。

AI赋能工业4.0：数据堂一站式数据服务加速制造智能化落地

工业4.0的浪潮正以前所未有的力量重塑全球制造业格局。从自动化生产线的普及到智能工厂的落地，从单一设备的升级到全产业链的协同，制造业正迈入数据驱动的智能新时代。这一转型既带来了前所未有的发展机遇，也伴随着诸多挑战。

#人工智能 #人机交互 #机器人

AI赋能工业4.0：数据堂一站式数据服务加速制造智能化落地

#人工智能 #人机交互 #机器人

数据竞赛 | 第二届多语种对话语音语言模型（MLC-SLM）挑战赛正式开启

#语言模型 #人工智能 #自然语言处理

共 69 条

请选择