logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

以实时速度运行 VLA模型

25年10月来自原力灵机(Dexmal/Dexbotic)公司和阶跃(StepFun)公司的论文"Running VLAs at Real-time Speed"。本文展示如何使用单个消费级GPU以30Hz帧率和最高480Hz轨迹频率运行π0级多视角VLA模型。这使得以往大型VLA模型无法完成的动态和实时任务成为可能。为了实现这一目标,引入一系列战略来消除模型推理中的开销。实际实验表明,采用该战略

文章图片
#机器人#机器学习#深度学习 +1
NanoVLA:面向Nano-大小通才机器人策略的解耦视觉-语言理解路由

25年10月来自加拿大UBC、加拿大 Alberta大学、小米电动汽车和加拿大东北大学的论文 “NanoVLA: Routing Decoupled Vision-Language Understanding For Nano-Sized Generalist Robotic Policies ”。视觉-语言-动作 (VLA) 模型通过将视觉-语言模型 (VLM) 和动作解码器集成到统一的架构中,

文章图片
#机器人#语言模型#机器学习 +1
谷歌的多模态语言大模型:PaLM-E

23年3月份谷歌(包括柏林工大)发布了一个多模态语言大模型PaLM-E,发表论文即“PaLM-E: An Embodied Multimodal Language Model“。

文章图片
#人工智能#深度学习#语言模型 +1
微软 14B 大模型 Phi-4

phi-4 是一个拥有 140 亿参数的语言模型,其训练方法主要关注数据质量。与大多数语言模型不同,phi-4 在整个训练过程中策略性地加入合成数据,而大多数语言模型的预训练主要基于 Web 内容或代码等有机数据源。虽然 Phi 系列中先前的模型在很大程度上蒸馏教师模型(特别是 GPT-4)的功能,但 phi-4 在聚焦 STEM 的 QA 功能方面大大超越教师模型,这证明数据生成和后训练技术在蒸

文章图片
#语言模型#机器学习#人工智能
大规模深度学习模型的高效训练:综述(下)

介绍23年4月的综述论文“On Efficient Training of Large-Scale Deep Learning Models: A Literature Review“,京东、悉尼大学和中科大的合作。

文章图片
#深度学习#人工智能#语言模型 +1
灵巧和具身机器人操作的发展与挑战:综述

25年7月来自浙大的论文“The Developments and Challenges towards Dexterous and Embodied Robotic Manipulation: A Survey”。实现类人灵巧的机器人操作一直是机器人领域的核心目标和关键挑战。人工智能(AI)的发展推动机器人操作的快速进步。本文概述机器人操作从机械编程到具身智能的演变历程,以及从简单夹爪到多指灵巧

文章图片
#机器人#机器学习#深度学习 +1
灵巧和具身机器人操作的发展与挑战:综述

25年7月来自浙大的论文“The Developments and Challenges towards Dexterous and Embodied Robotic Manipulation: A Survey”。实现类人灵巧的机器人操作一直是机器人领域的核心目标和关键挑战。人工智能(AI)的发展推动机器人操作的快速进步。本文概述机器人操作从机械编程到具身智能的演变历程,以及从简单夹爪到多指灵巧

文章图片
#机器人#机器学习#深度学习 +1
GPTutor: 一个可替代Copilot的开源AI配对编程工具

23年10月CMU的论文“GPTutor: an open-source AI pair programming tool alternative to Copilot”。

文章图片
#copilot#人工智能#语言模型
从安全角度看用大语言模型实现的自动驾驶

23年12月来自美国西北大学、耶鲁大学和英国利物浦大学的论文“Empowering Autonomous Driving with Large Language Models: A Safety Perspective“。

文章图片
#安全#语言模型#自动驾驶
当大语言模型遇到向量数据库:综述

24年2月来自CMU、普度大学、密西根大学等的综述论文“When Large Language Models Meet Vector Databases: A Survey”。

文章图片
#语言模型#数据库#人工智能
    共 631 条
  • 1
  • 2
  • 3
  • 64
  • 请选择