logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

二维卷积原理和代码-动手学计算机视觉2

二维卷积是图像处理的核心操作,通过滑动窗口对图像局部区域与卷积核进行乘加运算,生成新特征图。文章详细介绍了卷积原理(包括输入输出尺寸计算)、与相关运算的区别,以及模糊、边缘检测等常见应用场景。通过Python代码演示了单位卷积核和均值滤波的实现效果,展示了不同卷积核对图像处理的作用差异。该技术是计算机视觉和深度学习的基础,广泛应用于特征提取、图像增强等领域。

#深度学习#cnn#计算机视觉
人体姿态估计-动手学计算机视觉14

摘要:人体姿态估计是计算机视觉的重要任务,用于识别人体动作和姿势,在虚拟现实、人机交互等领域有广泛应用。本文介绍了二维姿态估计的基本概念,常用数据集(LSP、FLIC、MPII、MSCOCO)及评测指标(PCK、mAP)。重点阐述了DeepPose模型,它通过级联回归网络实现高精度关节点预测,并给出了简化版实现方案。实验在MSCOCO数据集上进行,验证了模型有效性。该技术为动作捕捉、运动分析等应用

#计算机视觉#人工智能#opencv +1
图片拼接-动手学计算机视觉8

图片拼接(image stitching)就是将统一场景的不同拍摄出的图片拼接到一起,如图所示就是拼接全景图,是图片拼接的应用之一,手机拍照都有全景拍摄功能仔细观察全景图,寻找它们相似性,图8-2的全景图可以通过缩放,旋转,射影等操作进行拼接而成,我们首先介绍几个常用的图像变换RANSAC(Random Sample Consensus)是一种鲁棒的模型拟合算法,常用于处理包含大量噪声或异常值的数

#计算机视觉#人工智能
一维卷积公式和代码-动手学计算机视觉1

摘要:本文介绍了一维卷积的数学原理和实现方法。卷积通过平移、翻转、相乘和累加运算处理信号,具有交换律、结合律和分配律特性。在离散信号处理中,为避免输出信号长度缩减,需进行零填充操作。文章详细说明了零填充的规则(填充数小于卷积核长度)并给出了Python实现代码,包括卷积计算和可视化功能。通过实例展示了不同卷积核(如单位冲激信号和方波)对三角波信号的不同处理效果,验证了卷积在信号平滑等方面的应用特性

#transformer#python#深度学习 +2
从零开始写个deer-flow-mvp-第一天

想开个blog记录一下自己的java转大模型之路,在这个路上许多都是未知,也许会有些犹豫,想要把自己的心路历程记录下来,供大家参考与交流。今天是第一天,先说明本人python基础薄弱,写过类似的项目,就想再写一个用来写在简历上,这两天研究了市场和机构情况,我觉得转行 AI 是可行的。虽然没有 AI 经验,但在大厂做过业务,C++ 背景也有帮助,所以不是完全从 0 开始。我选择转向大模型方向。算法研

#python#RAG#人工智能
实战Kaggle比赛:狗的品种识别(ImageNet Dogs)

比赛链接:Dog Breed Identification | Kaggle这里我们选择小批量进行训练出于学习目的先导入下载小数据集划分数据数据增强datasetdataset iter迁移学习loss评估函数train code可以看到30轮后面差不多就收敛了,当然还有很多提升空间,比如数据增强or使用vit_l_16或者更大的预训练模型做迁移学习,这里不多加概述一个低loss的代码实现:nb.

#人工智能
图像分割-动手学计算机视觉9

本文介绍了无监督图像分割技术,重点探讨了两种经典算法:基于k均值的图像分割和基于归一化割的图切割算法。k均值方法通过迭代优化将像素聚类为指定数量的区域,改进版通过加入坐标信息提升了分割连续性。图切割算法则将分割转化为最小割问题,通过能量函数优化实现前景背景分离。文章还展示了使用SAM(Segment Anything Model)进行高级分割的实践,包括自动分割和交互式点击选择目标两种方式。实验结

#计算机视觉#目标跟踪#人工智能 +2
图像分类-动手学计算机视觉10

介绍了视觉识别中最基本的问题之一图像分类。本章先后讲解了基于手工设计图像表正(视觉词袋模型)的图像分类算法和基于深度卷积神经网络的图像分类算法

#分类#计算机视觉#数据挖掘
图像分割-动手学计算机视觉9

本文介绍了无监督图像分割技术,重点探讨了两种经典算法:基于k均值的图像分割和基于归一化割的图切割算法。k均值方法通过迭代优化将像素聚类为指定数量的区域,改进版通过加入坐标信息提升了分割连续性。图切割算法则将分割转化为最小割问题,通过能量函数优化实现前景背景分离。文章还展示了使用SAM(Segment Anything Model)进行高级分割的实践,包括自动分割和交互式点击选择目标两种方式。实验结

#计算机视觉#目标跟踪#人工智能 +2
图像分类-动手学计算机视觉10

介绍了视觉识别中最基本的问题之一图像分类。本章先后讲解了基于手工设计图像表正(视觉词袋模型)的图像分类算法和基于深度卷积神经网络的图像分类算法

#分类#计算机视觉#数据挖掘
    共 15 条
  • 1
  • 2
  • 请选择