logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Qwen2.5-VL及Qwen3-VL关于default coordinate system的问题

本文对比了Qwen2.5-VL和Qwen3-VL在目标检测任务中坐标转换方法的差异。Qwen2.5-VL需要先获取预处理后的图片尺寸,再将模型输出的绝对坐标转换回原图坐标;而Qwen3-VL改用相对坐标系统(0-1000范围),可直接将输出坐标映射到原图尺寸,无需处理图片resize问题。主要区别在于Qwen3-VL采用了归一化的坐标表示方法,这有助于模型在不同分辨率和比例的图像上表现更稳定。文中

#目标检测#视觉检测
Failed to build transformer-engine/cudann位置

在Ubuntu的conda虚拟环境中安装transformer-engine时出现CMake错误,主要原因是未正确配置CUDNN路径。解决方案是:首先确认已安装cudnn(可通过pip list查看),然后设置环境变量CUDNN_PATH和CPLUS_INCLUDE_PATH,指向cudnn的安装路径(通常在conda环境目录下的nvidia/cudnn中)。具体步骤参考GitHub issue

#transformer#深度学习#人工智能
到底了