logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【论文精读】MotionSight: Boosting Fine-Grained Motion Understanding in Multimodal LLMs

本文是对论文《MotionSight: Boosting Fine-Grained Motion Understanding in Video-LLMs via Motion-Centric Data Curation》的精读解析。该研究针对多模态大模型在视频细粒度运动理解上的局限,提出创新的零样本增强方法MotionSight,并构建首个大规模运动感知数据集MotionVid-QA。本文旨在系统

文章图片
#计算机视觉#人工智能
【论文精读】MotionSight: Boosting Fine-Grained Motion Understanding in Multimodal LLMs

本文是对论文《MotionSight: Boosting Fine-Grained Motion Understanding in Video-LLMs via Motion-Centric Data Curation》的精读解析。该研究针对多模态大模型在视频细粒度运动理解上的局限,提出创新的零样本增强方法MotionSight,并构建首个大规模运动感知数据集MotionVid-QA。本文旨在系统

文章图片
#计算机视觉#人工智能
Docker 容器中 PyTorch GPU 不可用?一次完整的排查与解决全过程

摘要:在将一个深度学习镜像从服务器 A 迁移到服务器 B 时,我们遇到了一个典型问题:容器内 nvidia-smi 可以正常显示 GPU 信息,但 torch.cuda.is_available() 却返回 False。本文记录了从现象分析、多轮排查到最终定位并解决问题的完整过程,重点聚焦“配置看似一致却行为不同”的疑难场景,为类似问题提供可复用的解决方案。

文章图片
#docker#pytorch#容器 +2
到底了