logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【多模态】qwen3-vl的强化微调

基于ms-swift强化微调qwen3-vl

文章图片
【多模态】ViT模型技术学习

最近多模态模型特别火,一起从头学习ViT和Transformer!本文记录一下学习过程,所以是自上而下的写,从ViT拆到Transformer。

文章图片
#计算机视觉#人工智能
【大模型LLM学习】function call/agent学习记录

function call的学习记录(langchain+冷启动+微调)

文章图片
【多模态】swift框架使用qwen2-vl

前几篇里面学习了常见的一些多模态模型的典型架构和源代码,上一篇里面测试使用了minicpm-v系列模型,在尝试RLHF的时候发现swift特别好用特别全,记录一下对swift的一些使用,欢迎批评指正~前一篇里面写了minicpm-v的使用方法,这里主要记录qwen2-vl的使用。

文章图片
#swift#深度学习#人工智能
【多模态】多模态大模型MiniCPM-V技术学习

多模态大模型Minicpm-V-2.6参数8B,int4版本推理显存仅7GB,作为端侧大模型效果非常好,并且在幻觉数据集上效果优于其他模型,一起来学习为什么它这么强

文章图片
#计算机视觉#语言模型
【多模态】Flamingo模型技术学习

最近多模态模型特别火,从头开始学习!在前面写的几篇里面学习了MiniCPM-V、ViT、CLIP和BLIP/BLIP-2之后,今天学习一下Flamingo模型,记录学习过程,欢迎批评指正,一起学习~~

文章图片
#深度学习#人工智能#计算机视觉
    共 76 条
  • 1
  • 2
  • 3
  • 8
  • 请选择