
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
VTAM融合GelSight提升触觉动作预测
VTAM(视觉-触觉动作模型)通过将高分辨率触觉数据(如GelSight传感器数据)深度整合到其预测性世界建模框架中,显著提升了机器人在薯片抓取、黄瓜剥离等富接触任务中的动作预测能力和执行稳健性。其核心机制在于将触觉感知从传统的“辅助输入”提升为与视觉平等的“基础模态”,并进行联合动力学预测与正则化训练。VTAM并非简单地将触觉特征与视觉特征在后期(决策层)拼接,而是构建了一个。这种设计使得模型能
手机摄像头实时纠正健身动作
基于手机摄像头的健身动作实时纠错系统主要采用技术路线,通过摄像头捕捉人体运动姿态,结合深度学习模型分析关键点位置,最终通过算法判断动作标准性并提供实时反馈。
到底了







