logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

关于Qwen 3.5的学习(一)

技术报告阅览(AI辅助阅读)以往的视觉语言模型:是预训练好的语言模型 + 视觉编码器CLIP, 通过连接层进行强行连接原生:将图片和文字在预训练阶段就转化为同等地位的token。

关于Qwen 3.5的学习(一)

技术报告阅览(AI辅助阅读)以往的视觉语言模型:是预训练好的语言模型 + 视觉编码器CLIP, 通过连接层进行强行连接原生:将图片和文字在预训练阶段就转化为同等地位的token。

到底了