logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

PyTorch神经网络(DNN-CNN)基础与实战

本篇文字是为了深入了解深度神经网络(DNN)和卷积神经网络(CNN)的基础知识和实战技巧,并使用PyTorch框架进行实际操作和模型实现。

文章图片
#pytorch#dnn#cnn
计算机视觉目标检测-1

目标检测算法从早期的暴力穷举逐步发展到基于深度学习的高效框架,如RCNN和SPPNet。RCNN通过候选区域和CNN结合,大幅提高了检测精度,但其多阶段训练过程复杂,耗时且占用大量磁盘空间。SPPNet的出现利用SPP层实现CNN层共享,显著提升了训练效率,启发了后续的Fast R-CNN等方法。然而,SPPNet仍需多阶段训练,效率提升有限。

文章图片
#计算机视觉#目标检测#人工智能
机器学习核心任务

​机器学习是通过让计算机从数据中自动学习并进行预测或分析的技术。其核心任务主要包括回归与分类。回归致力于预测连续值输出,如线性回归通过拟合最佳直线预测目标变量;逻辑回归虽名含“回归”,实则应用于分类,利用Sigmoid函数转换预测连续概率。分类任务则是将数据分配至预设类别,如决策树通过特征分割数据,采用剪枝策略防过拟合;支持向量机(SVM)通过找到最大化类别间隔的边界进行分类,可选多种核函数适应不

文章图片
#sklearn#机器学习#决策树
计算机视觉目标检测-DETR网络

DETR(DEtection TRansformer)是由Facebook AI提出的一种基于Transformer架构的端到端目标检测方法。它通过将目标检测建模为集合预测问题,摒弃了锚框设计和非极大值抑制(NMS)等复杂后处理步骤。DETR使用卷积神经网络提取图像特征,并将其通过位置编码转换为输入序列,送入Transformer的Encoder-Decoder结构。Decoder通过固定数量的目

文章图片
#计算机视觉#目标检测#人工智能
RT-DETR

本周看了一篇《DETRs Beat YOLOs on Real-time Object Detection》设计了一种高效的混合编码器,通过解耦尺度内交互和跨尺度融合来提高速度来快速处理多尺度特征;同时提出了不确定性最小查询选择来为解码器提供高质量的初始查询,从而提高准确率。此外,RT-DETR通过调整解码器的数量来适应各种场景而无需重新训练来支持灵活的速度调整。它不仅在速度和准确性上都优于之前先

文章图片
#transformer#计算机视觉#深度学习
图像生成GAN和风格迁移

本周学习了生成对抗网络(GAN)与风格迁移技术在图像生成中的应用。首先介绍了GAN模型中生成器与判别器通过对抗训练,使随机噪声逐步转换为逼真图像,展示了其在动漫人物生成中的潜力。其次阐述了风格迁移方法,通过预训练卷积网络提取图像内容和风格特征,并构建内容、风格及总变差损失,实现艺术风格转换。本周阅读论文《Perceptual Losses for Real-Time Style Transfer

文章图片
#生成对抗网络#人工智能#神经网络
计算机视觉目标检测-DETR网络

DETR(DEtection TRansformer)是由Facebook AI提出的一种基于Transformer架构的端到端目标检测方法。它通过将目标检测建模为集合预测问题,摒弃了锚框设计和非极大值抑制(NMS)等复杂后处理步骤。DETR使用卷积神经网络提取图像特征,并将其通过位置编码转换为输入序列,送入Transformer的Encoder-Decoder结构。Decoder通过固定数量的目

文章图片
#计算机视觉#目标检测#人工智能
机器学习中的聚类

聚类是无监督学习中的重要任务,旨在将数据集划分为若干个子集(簇),使得同一簇内的样本相似度高而不同簇间的样本相似度低。本周学习了聚类的性能度量指标,包括内部和外部指标,如Jaccard系数、Rand指数、DB指数等,并介绍了几种常见的距离计算方法。此外,深入学习了几种原型聚类算法:k均值、学习向量量化(LVQ)以及高斯混合模型(GMM),并以K-means算法为例,通过鸢尾花数据集进行了实战演示。

文章图片
#机器学习#聚类#sklearn
机器学习---无监督学习

本周探讨了无监督学习中的几种关键方法,包括高斯混合模型(GMM)、聚类算法(如K-Means和Mean Shift)以及受限玻尔兹曼机(RBM)。高斯混合模型利用概率模型来拟合数据,并通过可视化展示了其对二维数据集的预测轮廓。聚类部分涵盖了多种算法的性能和局限性,如K-Means和Mean Shift,并提供了具体示例。最后,还介绍了受限玻尔兹曼机的工作原理及其在特征学习中的应用。

文章图片
#机器学习#scikit-learn#聚类 +1
注意力蒸馏技术

本周阅读了一篇25年二月份发表于CVPR 的论文《Attention Distillation: A Unified Approach to Visual Characteristics Transfer》,论文开发了Attention Distillation引导采样,这是一种改进的分类器引导方法,将注意力蒸馏损失整合到去噪过程中,大大加快了合成速度,并支持广泛的视觉特征迁移和合成应用。最近扩散

文章图片
    共 12 条
  • 1
  • 2
  • 请选择