logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

RT-1模型架构(自用复习)

模型通过自注意力机制,无障碍地分析“苹果”(视觉令牌)、“捡起绿色海绵”(语言令牌)和“先前手的位置”(动作令牌)之间的关系,然后预测出。:对于机械臂的7个维度(x, y, z, 横滚,俯仰,偏航,夹爪)和底盘的3个维度(x, y, θ),分别将其可能的取值范围均匀划分为256个区间。是一个可学习的模块,它可以从EfficientNet输出的81个视觉令牌中,动态地筛选出最相关的少数几个(如8个)

#人工智能#机器人
到底了