
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
24年4月来自DeepSeek-AI、清华和北大的论文“DeepSeekMath: Pushing the Limits of Mathematical Reasoning in Open Language Models”。数学推理因其复杂性和结构性而对语言模型构成了重大挑战。本文引入 DeepSeekMath 7B,它继续使用来自 Common Crawl 的 120B 个数学相关tokens以

24年8月来自Turing公司、东京大学、筑波大学、庆应义塾大学的研究所和日本信息学研究所的论文“CoVLA: Comprehensive Vision-Language-Action Dataset for Autonomous Driving”。

24年3月来自斯坦福和伯克利分校的论文“DROID: A Large-Scale In-The-Wild Robot Manipulation Dataset”。

23年5月主要来自CMU团队的论文“WEDGE: A multi-weather autonomous driving dataset built from generative vision-language models“。

25年2月来自阿联酋 MBZUAI、中科院自动化所、香港城市大学、香港科技大学广州分校、英国格拉斯哥的 Strathclyde 大学、小红书、华东师范大学和南方科技大学的论文“From System 1 to System 2: A Survey of Reasoning Large Language Models”。要实现人类水平的智能,需要改进从快速、直观、系统 1 到较慢、更慎重、系统 2

21年3月来自Facebook AI,UT Austin,Georgia Tech,Simon Fraser U 和 Cornell U的论文“Habitat-Matterport 3D Dataset (HM3D): 1000 Large-scale 3D Environments for Embodied AI”。

24年11月来自Rutgers大学和百度美研的论文“RT-Grasp: Reasoning Tuning Robotic Grasping via Multi-modal Large Language Model”。大语言模型 (LLM) 的最新进展展示了其卓越的推理能力,使其在各个领域都具有影响力。然而,在机器人技术领域,由于其固有的文本输出,它们的使用主要限于操作规划任务。本文研究采用 LLM

24年1月来自UCBerkeley、Stanford、Google和CMU的论文“BridgeData V2: A Dataset for Robot Learning at Scale”。

24年1月来自清华、北大和上海姚期智研究院的更新论文“HOI4D: A 4D Egocentric Dataset for Category-Level Human-Object Interaction”。

25年2月来自CMU的论文“Training Language Models to Reason Efficiently”。扩展模型大小和训练数据已带来大语言模型 (LLM) 的性能取得巨大进步。然而,这种方法的收益递减需要替代方法来提高模型能力,特别是在需要高级推理的任务中。利用长链思维的大型推理模型在解决问题的能力方面带来了前所未有的突破,但部署成本却与更长的生成有关。降低推理成本,对于这些模
