logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

基于ONNX-YOLOv10-Object-Detection项目实现yolov10模型onnx-python推理

项目依赖:onnxruntime-gpu、opencv-python、imread-from-url、cap-from-youtube、ultralytics。

文章图片
#python
如何实现sam(Segment Anything Model)|fastsam模型

通过本博文的查阅与分析,实现fastsam是较为简便的,且fastsam的性能可以随着全景实例分割模型的发展而进一步提升,同时也说明了fastsam中prompt的实现。而在sam中,各种实现较为生涩难懂,主要说明sam的模型结构,基本原理,数据生成范式。sam的亮点在于基于少量的语义分割标签,迭代出了一个1.1B 标签超大型数据集,其不断扩展标注数据量的思想是值得学习的;而在fastsam中则是

文章图片
#图像处理
使用自己训练的superpoint与superglue模型进行图像配准

基于官方团队发布的预训练模型,使用SuperPoint与SuperGlue实现图像配准,可以参考基于官方团队发布的代码训练自己的模型,可以参考进行实现,训练出的模型不能直接参考上述博客进行部署,为此发布使用代码。本博文实现基于进行改进。

文章图片
论文翻译:VSA | Faster Video Diffusion with Trainable Sparse Attention

项目地址:https://github.com/hao-ai-lab/FastVideo模型地址:https://huggingface.co/FastVideo/FastWan2.1-T2V-1.3B-Diffusers/tree/main发表时间:2025.8.4 (v4版本)DiTs的扩展能力受限于其二次3D注意力机制,尽管大部分注意力权重集中在少量位置子集上。我们将这一发现转化为VSA,一

文章图片
#AIGC
如何选择出最适合的backbone模型?图像分类模型性能大摸底

到2023年图像分类backbone模型已经拓展到了几十个系列,而有的新算法还在采样vgg、resnet做backbone,比如2022年提出的GDIP-YOLO还在用VGG16做IA参数预测,那是在浪费计算资源并限制了模型性能的提升,应该将目光放到现在的最新模型中。以PaddleClas所支持的模型为基准对现行图像分类模型进行进行一个摸底,具体分为移动端模型、桌面端模型、服务器级模型。以在ima

文章图片
#分类#人工智能#深度学习
模型剪枝实战|基于torch-pruning库代码对yolov8进行剪枝

torch-pruning库是一个开源的模型剪枝库,yolov8是是一个2年前较为先进的目标检测模型。在torch-pruning库中有很多模型剪枝案例,本文以yolov8剪枝代码为案例进行分析,代码路径在torch-pruning项目下examples\yolov8\yolov8_pruning.py。本博文基于官方代码对coco128数据进行剪枝尝试,发现剪枝后的map有6个点的下降,这主要是

文章图片
#剪枝#算法
深度学习中有哪些较为有效的数据增广方式?

在图像分类任务中,图像数据的增广是一种常用的正则化方法,常用于数据量不足或者模型参数较多的场景。在本章节中,我们将对除 ImageNet 分类任务标准数据增广外的8种数据增广方式进行简单的介绍和对比,用户也可以将这些增广方法应用到自己的任务中,以获得模型精度的提升。这8种数据增广方式在ImageNet上的精度指标如下所示。...

文章图片
#计算机视觉#人工智能
深度学习中有哪些较为有效的数据增广方式?

在图像分类任务中,图像数据的增广是一种常用的正则化方法,常用于数据量不足或者模型参数较多的场景。在本章节中,我们将对除 ImageNet 分类任务标准数据增广外的8种数据增广方式进行简单的介绍和对比,用户也可以将这些增广方法应用到自己的任务中,以获得模型精度的提升。这8种数据增广方式在ImageNet上的精度指标如下所示。...

文章图片
#计算机视觉#人工智能
FastDeploy项目简介,使用其进行(图像分类、目标检测、语义分割、文本检测|orc部署)

FastDeploy是一款全场景、易用灵活、极致高效的AI推理部署工具, 支持云边端部署。提供超过 🔥160+ Text,Vision, Speech和跨模态模型📦开箱即用的部署体验,并实现🔚端到端的推理性能优化。包括 物体检测、字符识别(OCR)、人脸、人像扣图、多目标跟踪系统、NLP、Stable Diffusion文图生成、TTS 等几十种任务场景,满足开发者多场景、多硬件、多平台的产

文章图片
#目标检测#深度学习
一文了解21年起2025的10种LoRA相关算法(LoRA、Delta-LoRA、VeRA、LoRA-drop、LoRA+、EDoRA)

在原有的参数旁,新增一个低秩分解的通路A、B,其中秩为r(r远小于n1、n2)。矩阵A进行高斯分布初始化,矩阵B进行全0初始化。额外有一个参数a,用于控制初始化参数的缩放。∆WxBA∆W_x=BA∆Wx​BA按α/r进行缩放,其中α是关于r的常数。在使用Adam优化器时,如果我们对初始化进行了适当缩放,调整α大致等同于调整学习率。该方法在每层LoRA结构中冻结降维投影权重A,仅更新升维投影权重B。

文章图片
#深度学习
    共 94 条
  • 1
  • 2
  • 3
  • 10
  • 请选择