logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

SmolVLM-Married-Qwen3 缝合怪-超小多模态中文模型

本文介绍了基于SmolVLM2-256M和Qwen3-0.6B的多模态大模型微调实验。作者针对视觉定位任务,使用Objects365数据集进行训练,包含图像描述、问答和检测任务。通过冻结部分网络层和LoRA微调的方式,在有限算力下完成了模型训练。实验结果表明,小规模多模态模型在定位任务上表现有限,可能更适合图文对话等轻量级应用。文章详细记录了数据处理、模型训练、权重合并和推理部署的全过程,并探讨了

文章图片
#人工智能
【Tensorflow】LeNet-5训练MNIST数据集

LeNet-5共有7层,不包含输入,每层都包含可训练参数;每个层有多个Feature Map,每个FeatureMap通过一种卷积滤波器提取输入的一种特征,然后每个FeatureMap有多个神经元。根据其他博客,利用MNIST训练LeNet-5网络,并做了测试。目录 1.LeNet-5网络2.LeNet-5代码3.测试结果代码地址1.LeNet-5网络1.1 网...

opencv获取多个摄像头名字和编号

因为项目需要,利用opencv读取多个摄像头,但没法确定摄像头的编号。查看opencv的源码,摄像头的id主要利用了listDevices这个函数,自己把这个函数单独提取出来,根据vectorint listDevices(vector& list){//COM Library Intialization//comInit();//if (!silent)printf("\nV

图像颜色增强算法Opencv

算法来源于GIMP中的Color-enhance插件,主要思路就是对HSV空间的V值进行重新量化。其代码是开源的,但用起来不太方便,所以我用Opencv重新改写了一下。一、算法主要步骤:1.图像转换到CMY空间,每个像素点(三通道,包含C、M、Y三个值)各减去最小值,即C -=min(C,M,Y),M -=min(C,M,Y),Y -=min(C,M,Y)。2.1中得到的图像转换到HS

#算法#opencv
表情识别------CNN训练fer2013数据集

目录1.概述2.环境3.数据读取4.VGG5.Resnet6.摄像头表情识别1.概述分别用vgg和resnet对fer2013做了训练,只是简单的实现,没有做什么其他改进方法,在测试集的accuracy并不高,仅做练习。文末用训练好的模型做了摄像头表情检测,仅供参差。2.环境face_recognition==1.2.3opencv_python=...

面试笔试--TCP/IP知识点

下面的图表试图显示不同的TCP/IP和其他的协议在最初OSI模型中的位置:7应用层例如HTTP、SMTP、SNMP、FTP、Telnet、SIP、SSH、NFS、RTSP、XMPP、Whois、ENRP6表示层例如XDR、ASN.1、SMB、AFP、NCP5会话层例如ASAP、TLS、SSH、ISO8327 / CCIT

#网络#面试
boost---shared_ptr笔记

shared_ptr是包装了new操作符在堆上分配的动态对象,能够保证动态创建的对象在任何时候都可以被正确的删除,它实现的是引用计数型的智能指针,可以被自由的拷贝和赋值,在任意的地方共享它,当没有代码使用(引用计数为0时)它时才可以被删除。shared_ptr可以被安全的放到标准容器中,并弥补了auto_ptr因为转移语义而不能把指针作为STL容器元素的缺陷。

#c++
到底了