logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

LYT-NET:一个超级轻量的低光照图像增强Transformer网络

本文提出了LYT-Net,这是一个新颖的、轻量的、transformer-based的低光照图像增强模型,它由几个层和可拆卸的块组成,包括我们的新块——Channel-Wise Denoiser (CWD)和Multi-Stage Squeeze & Excite Fusion (MSEF)——以及传统的Transformer块,Multi-Headed Self-Attention (MHSA)

文章图片
#transformer#深度学习#人工智能
Dynamic Head:统一目标检测Heads和注意力

在目标检测方法中,由于分类和定位组合的复杂性,产生了多种多样的算法。这些算法尝试在检测heads上提升性能,不过它们缺乏一种统一的视角来看待检测问题。基于此,本文提出了一个新颖的动态head框架,将注意力机制与目标检测Heads统一起来。

文章图片
Objects365数据集下载与信息统计

介绍了Objects365数据集,并提供了百度网盘下载链接;同时,给出了数据集的统计信息。

文章图片
基于coco数据集的人体关键点分布示意图与数据集解析

本文绘制了coco中人体姿态关键点的分布示意图,并解释了每个关键点的含义。

文章图片
mmsegmentation: 安装并使用自定义数据集进行训练

本文从实际的案例出发,介绍了如何在mmsegmentation使用自定义数据集和添加自定义模块,并介绍了安装过程的一些坑;供大家学习交流。

文章图片
RTMO: 超越YOLO-pose的高性能、单阶段、多人姿态估计

提出的RTMO框架如下图所示:网络框架描述如下:输入图像经过backbone(CSPDarknet)后,最后三层feature map经过Hybrid Encoder得到16、32倍下采样的空间feature mapP4、P5,送入Heads;每个Head生成一个得分feature、一个坐标姿态feature,其中坐标姿态feature用于预测bbox、关键点坐标、关键点可见性。****强行插入一

文章图片
LLM+文生图:离线部署、中文提示、急速生成

本文介绍了一种基于中文大模型和FLUX.1文生图模型的图像生成系统。该系统通过中文LLM将用户输入的中文提示词转换为专业英文提示词,再输入到FLUX.1模型生成图像

文章图片
#人工智能
从PA100K数据集中提取性别

本文提供了一个从PA100K数据集中提取性别属性的方法。

文章图片
#python
DETR:使用transformer进行端到端目标检测

本文主要是基于transformers和双边匹配损失设计了一种新的目标检测范式——DETR,可以直接进行one-to-one预测。在COCO数据集上,DETR与高度优化的Faster RCNN性能相当。DETR应用简单,且拥有固定结构,可方便的扩展到全景分割等领域,并能达到不错的效果。此外,在大型目标的效果上, 是由于Faster RCNN的,这可能是因为DETR中的大量自注意力机制的应用使得模型

文章图片
#目标检测
Python tkinter: 开发一个目标检测GUI小程序

程序提供了一个用户友好的界面,允许用户选择图片或文件夹,使用行人检测模型进行处理,并在GUI中显示检测结果。用户可以通过点击画布上的检测结果来获取更多信息,并使用键盘快捷键来浏览不同的图片。

文章图片
#python
    共 84 条
  • 1
  • 2
  • 3
  • 9
  • 请选择