TalkU浩克个人主页

@hyqwmxsh

TalkU浩克

2023-04-17 21:31:26 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

SmolVLM-Married-Qwen3 缝合怪-超小多模态中文模型

本文介绍了基于SmolVLM2-256M和Qwen3-0.6B的多模态大模型微调实验。作者针对视觉定位任务，使用Objects365数据集进行训练，包含图像描述、问答和检测任务。通过冻结部分网络层和LoRA微调的方式，在有限算力下完成了模型训练。实验结果表明，小规模多模态模型在定位任务上表现有限，可能更适合图文对话等轻量级应用。文章详细记录了数据处理、模型训练、权重合并和推理部署的全过程，并探讨了

#人工智能

【Tensorflow】LeNet-5训练MNIST数据集

LeNet-5共有7层，不包含输入，每层都包含可训练参数；每个层有多个Feature Map，每个FeatureMap通过一种卷积滤波器提取输入的一种特征，然后每个FeatureMap有多个神经元。根据其他博客，利用MNIST训练LeNet-5网络，并做了测试。目录 1.LeNet-5网络2.LeNet-5代码3.测试结果代码地址1.LeNet-5网络1.1 网...

opencv获取多个摄像头名字和编号

因为项目需要，利用opencv读取多个摄像头，但没法确定摄像头的编号。查看opencv的源码，摄像头的id主要利用了listDevices这个函数，自己把这个函数单独提取出来，根据vectorint listDevices(vector& list){//COM Library Intialization//comInit();//if (!silent)printf("\nV

图像颜色增强算法Opencv

算法来源于GIMP中的Color-enhance插件，主要思路就是对HSV空间的V值进行重新量化。其代码是开源的，但用起来不太方便，所以我用Opencv重新改写了一下。一、算法主要步骤：1.图像转换到CMY空间，每个像素点(三通道，包含C、M、Y三个值)各减去最小值，即C -=min（C,M,Y），M -=min（C,M,Y），Y -=min（C,M,Y）。2.1中得到的图像转换到HS

#算法 #opencv

表情识别------CNN训练fer2013数据集

目录1.概述2.环境3.数据读取4.VGG5.Resnet6.摄像头表情识别1.概述分别用vgg和resnet对fer2013做了训练，只是简单的实现，没有做什么其他改进方法，在测试集的accuracy并不高，仅做练习。文末用训练好的模型做了摄像头表情检测，仅供参差。2.环境face_recognition==1.2.3opencv_python=...

面试笔试--TCP/IP知识点

下面的图表试图显示不同的TCP/IP和其他的协议在最初OSI模型中的位置：7应用层例如HTTP、SMTP、SNMP、FTP、Telnet、SIP、SSH、NFS、RTSP、XMPP、Whois、ENRP6表示层例如XDR、ASN.1、SMB、AFP、NCP5会话层例如ASAP、TLS、SSH、ISO8327 / CCIT

#网络 #面试

boost---shared_ptr笔记

shared_ptr是包装了new操作符在堆上分配的动态对象，能够保证动态创建的对象在任何时候都可以被正确的删除，它实现的是引用计数型的智能指针，可以被自由的拷贝和赋值，在任意的地方共享它，当没有代码使用（引用计数为0时）它时才可以被删除。shared_ptr可以被安全的放到标准容器中，并弥补了auto_ptr因为转移语义而不能把指针作为STL容器元素的缺陷。

#c++

到底了