
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
25年10月来自原力灵机(Dexmal/Dexbotic)公司和阶跃(StepFun)公司的论文"Running VLAs at Real-time Speed"。本文展示如何使用单个消费级GPU以30Hz帧率和最高480Hz轨迹频率运行π0级多视角VLA模型。这使得以往大型VLA模型无法完成的动态和实时任务成为可能。为了实现这一目标,引入一系列战略来消除模型推理中的开销。实际实验表明,采用该战略

25年10月来自加拿大UBC、加拿大 Alberta大学、小米电动汽车和加拿大东北大学的论文 “NanoVLA: Routing Decoupled Vision-Language Understanding For Nano-Sized Generalist Robotic Policies ”。视觉-语言-动作 (VLA) 模型通过将视觉-语言模型 (VLM) 和动作解码器集成到统一的架构中,

23年3月份谷歌(包括柏林工大)发布了一个多模态语言大模型PaLM-E,发表论文即“PaLM-E: An Embodied Multimodal Language Model“。

phi-4 是一个拥有 140 亿参数的语言模型,其训练方法主要关注数据质量。与大多数语言模型不同,phi-4 在整个训练过程中策略性地加入合成数据,而大多数语言模型的预训练主要基于 Web 内容或代码等有机数据源。虽然 Phi 系列中先前的模型在很大程度上蒸馏教师模型(特别是 GPT-4)的功能,但 phi-4 在聚焦 STEM 的 QA 功能方面大大超越教师模型,这证明数据生成和后训练技术在蒸

介绍23年4月的综述论文“On Efficient Training of Large-Scale Deep Learning Models: A Literature Review“,京东、悉尼大学和中科大的合作。

25年7月来自浙大的论文“The Developments and Challenges towards Dexterous and Embodied Robotic Manipulation: A Survey”。实现类人灵巧的机器人操作一直是机器人领域的核心目标和关键挑战。人工智能(AI)的发展推动机器人操作的快速进步。本文概述机器人操作从机械编程到具身智能的演变历程,以及从简单夹爪到多指灵巧

25年7月来自浙大的论文“The Developments and Challenges towards Dexterous and Embodied Robotic Manipulation: A Survey”。实现类人灵巧的机器人操作一直是机器人领域的核心目标和关键挑战。人工智能(AI)的发展推动机器人操作的快速进步。本文概述机器人操作从机械编程到具身智能的演变历程,以及从简单夹爪到多指灵巧

23年10月CMU的论文“GPTutor: an open-source AI pair programming tool alternative to Copilot”。

23年12月来自美国西北大学、耶鲁大学和英国利物浦大学的论文“Empowering Autonomous Driving with Large Language Models: A Safety Perspective“。

24年2月来自CMU、普度大学、密西根大学等的综述论文“When Large Language Models Meet Vector Databases: A Survey”。








