logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

告别“炼丹玄学”:上海AI实验室推出首个大模型数据竞技场OpenDataArena

数据在AI时代的重要性已经不言而喻,但悬而未决的是——如何精确量化这些数据的价值、辨别其优劣?为此,上海人工智能实验室OpenDataLab团队在数据领域持续深耕,正式推出了。地址:https://opendataarena.github.io/index.html工具:https://github.com/OpenDataArena/OpenDataArena-Tool数据:https://hu

#人工智能
告别“炼丹玄学”:上海AI实验室推出首个大模型数据竞技场OpenDataArena

数据在AI时代的重要性已经不言而喻,但悬而未决的是——如何精确量化这些数据的价值、辨别其优劣?为此,上海人工智能实验室OpenDataLab团队在数据领域持续深耕,正式推出了。地址:https://opendataarena.github.io/index.html工具:https://github.com/OpenDataArena/OpenDataArena-Tool数据:https://hu

#人工智能
战略科学家对话:AI+科学,数据和人才是关键

针对当前生命科学领域文本类数据已经“不够用”的现实困境,孙勇奎分享了解决思路,“进一步挖掘人类的生物数据并同步建立新数据生成机制,可以更好地开展AI训练,甚至让AI自行检索全球科研成果,提出更具潜力的假说并加以验证,进而提高药物研发成功率。罗毅介绍了合肥实验室的“AI化学家”,经过三年的迭代,它已经能自动完成80%的化学实验。他还分享了一则案例,实验室一名偏理论研究的同学,在AI的辅助下,仅用六个

#人工智能#百度
教程 | 给大模型插上小语种“翅膀”,附ms-swift韩语继续预训练与指令微调教程

在阿拉伯语、俄语、韩语、越南语、泰语5个语种基础上,新增塞尔维亚语、匈牙利语、捷克语等3个稀缺语料数据。在纯文本数据基础上,新增图片-文本、音频-文本、视频-文本、特色指令微调SFT四大模态数据,覆盖多模态研究全链路;整体数据总量超过1150万条,音视频时长超过2.6万小时,满足多种研究任务的需求。

#人工智能#自然语言处理
从手写数字识别入门深度学习丨MNIST数据集详解

就像无数人从敲下“Hello World”开始代码之旅一样,许多研究员从“MNIST数据集”开启了人工智能的探索之路。

文章图片
#深度学习#计算机视觉#人工智能
激光雷达(LiDAR)点云数据知多少?

在自动驾驶系统中,激光雷达作为环境感知设备,其采集的点云数据对三维目标检测、反馈周围是否有障碍物、距离前车有多远等起着重要作用。给大家具体介绍一下。

文章图片
#自动驾驶#人工智能#机器学习
WAIC上官宣!大模型语料提取工具MinerU正式发布,开源免费“敲”好用

7月4日,2024 WAIC科学前沿全体会议在上海世博中心红厅隆重举行。上海人工智能实验室与商汤科技联合香港中文大学和复旦大学正式发布新一代大语言模型书⽣·浦语2.5(InternLM2.5),同时全链条工具体系迎来重磅升级,对于,不仅能将混合了图片、表格、公式等在内的复杂多模态 PDF 文档精准转化为清晰、易于分析的 Markdown 格式,还能从包含广告等各种干扰信息的网页中快速解析、抽取正式

文章图片
#人工智能#大数据
上海AI实验室无人机视觉语言导航最新基准!OpenFly:空中VLN的全能工具链与大规模测试基准

论文提出了OpenFly平台,用于大规模数据收集和室外空中VLN任务。OpenFly集成了多种渲染引擎,生成了多样且高质量的数据。提出的OpenFly-Agent模型在多个评估指标上表现优异,验证了其有效性,并为未来的空中导航研究提供了一个全面的基准。本文仅做学术分享。

#人工智能#无人机
国家数据局点赞!OpenDataLab小语种数据标注方案入选《数据标注优秀案例集》

上海人工智能实验室OpenDataLab团队的小语种数据标注创新模式入选国家优秀案例。该团队打造了"万卷·丝路"多模态语料库,涵盖8种小语种的跨模态数据,并开发了LabelU和LabelLLM等开源工具。通过自主研发智能标注平台和标准化管理方案,标注效率提升50%,成本降低70%。创新亮点包括大模型标注技术、人机结合质检、系列标注工具开发及灵活的工作流程管理。该方案为小语种数据

#人工智能#开源#自然语言处理
    共 108 条
  • 1
  • 2
  • 3
  • 11
  • 请选择