logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【opencv】使用鼠标绘图、输出指定位置RGB/ 灰度像素值

主要参考【官方代码】 Mouse as a Paint-Brush【官方文档】鼠标回调的事件(MouseEvent)、事件状态(MouseEventFlags)示例1:双击鼠标画圆EVENT_LBUTTONDBLCLK:双击(DBL)鼠标左键(L)出发opencv函数import numpy as npimport cv2 as cv# mouse callback functiondef dra

文章图片
#opencv
【opencv】图片放大缩小到指定大小或按指定比例f放大缩小(resize函数)c++

简介本文实验是在Ubuntu下基于opencv3.4.6的resize()函数进行图片的大小变换的,主要有两种方式,一种是指定的变换后的图像大小,一种是给出图像放大缩小的比例,lena原图大小为 【512x512】分别变换为【456x123】,和【512*0.5,512*3】,结果:【此为原图】【结果图比较畸形,就不做显示了--】C++实现代码之前项目比较急的时候,在设定图像变换大小的时候,总是将

#opencv#c++#计算机视觉
【stable-diffuision-webui】controlnet制作动漫二维码(丐版)

基于AI生成可扫码图像,可结合lora和不同的模型,定制自己的二维码内容

文章图片
【论文简介】2204.VQGAN-CLIP(已开源):Open Domain Image Generation and Editing with Natural Language Guidance

从`开放域`(open domain)`文本提示`(text prompts)中`生成和编辑图像`是一项具有挑战性的任务,迄今为止(heretofore)一直需要昂贵的和经过专门训练的模型。- 我们演示了一种针对这两种任务的新方法,该方法能够通过使用`多模态编码器` (multimodal encoder) 来指导图像生成,在没有任何训练的情况下,从具有显著语义复杂度的文本提示中生成高视觉质量的图

#计算机视觉
【论文】2102.DALL-E: Zero-Shot Text-to-Image Generation(文字生成各种各样充满想象图像的开端)

DALL-E通过120亿参数的模型,在2.5亿图像文本对上训练完成。它是一个两阶段的模型:它的第一个阶段是离散变分自编码器(Discrete Variance Auto-Encoder,dVAE),用于生成图像的token。它的第二个阶段是混合了图像和文本特征的,以Transformer为基础的生成模型

文章图片
#AIGC
【图像搜索】基于pytorch官方预训练模型的简易相似图片搜索

简易的相似图像搜索算法图片数据库查询结果本文主要方法流程预训练模型 +单张图像的特征 ( 逐个保存,形成数据库)+ 特征压缩(选做)获取查询图像的特征向量将查询的特征向量与数据库保存的所有特征进行余弦距离计算返回结果实际编写自定义图片数据集读取代码pytorch SWAV预训练模型(paper Unsupervised Learning of Visual Features by Contrast

#pytorch
【图像分割】SAM:Segment Anything论文学习V1

一个重量级的()图像编码器输出一个图像的特征编码,可以通过各种输入提示(a variety of inputprompts)高效地查询,以实现分割目标掩码,并以摊销的实时速度进行处理。对于与多个对象对应的模糊提示,SAM可以输出多个有效的掩码,并附带置信度得分。备注(·图像嵌入 image embedding是指将图像转换为固定长度高纬向量表示的过程。它是通过将图像输入到深度神经网络中的图像编码器

文章图片
#计算机视觉
【ollama安装】国内 linux 环境安装ollama

使用命令行前,请确保已经通过pip install modelscope 安装ModelScope。

文章图片
#linux
    共 75 条
  • 1
  • 2
  • 3
  • 8
  • 请选择