logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

PyTorch实战(33)——使用fastai进行快速原型开发

在本节中,我们对 fastai 进行了简要介绍并将其用于训练 MNIST 手写数字识别模型。fastai 为机器学习工程师和研究人员提供了丰富功能,本节旨在展示 fastai 的高效性和易用性,所学内容可迁移至其他 fastai 机器学习任务。本质上 fastai 基于 PyTorch 功能构建,因此这两个框架可以随时切换使用。

文章图片
#pytorch#深度学习#人工智能
一文开启监督学习之旅

近年来,机器学习已经成为最热门的研究领域之一,机器学习通常可以分为监督学习和无监督学习。本文主要介绍监督学习的两种主要场景:分类和回归。介绍了数据分类问题并构建分类模型,了解了多种数据预处理技术,其中还包括标签编码。还介绍了使用逻辑回归构建分类器,了解了如何构建混淆矩阵。还介绍了如何使用支持向量机构建分类模型。在回归任务中,介绍了如何将线性和多项式回归用于单变量和多变量数据。

文章图片
#机器学习#分类#回归
使用Julia进行图像处理--用于扩充训练集的图像增强

使用Julia进行图像处理--用于扩充训练集的图像增强,可用于深度学习的数据增强技术,使用julia language实现,主要包括图片模糊,锐化,填充和修改图片饱和度等。

#计算机视觉#深度学习#图像处理
视觉Transformer实战 | Pooling-based Vision Transformer(PiT)详解与实现

Vision Transformer (ViT) 在计算机视觉领域取得了巨大成功,但标准的 ViT 架构在处理不同尺度的视觉特征时存在一定局限性。Pooling-based Vision Transformer (PiT) 通过引入池化操作来改进 ViT 架构,使其能够更有效地处理多尺度特征,同时减少计算复杂度。本节将详细介绍 PiT 的技术原理,并使用 PyTorch 从零开始实现 PiT 模型

文章图片
#transformer#深度学习#计算机视觉
视觉Transformer实战 | Token-to-Token Vision Transformer(T2T-ViT)详解与实现

Vision Transformer (ViT) 在计算机视觉领域取得了巨大成功,但标准的 ViT 存在一些局限性,如需要大规模预训练数据、对局部结构建模不足等。Token-to-Token ViT (T2T-ViT) 通过引入渐进式分词过程改进了原始 ViT,使其能够在中小型数据集上取得更好的性能。本节将详细介绍 T2T-ViT 的技术原理,并使用 PyTorch 从零开始实现 T2T-ViT。

文章图片
#transformer#深度学习#计算机视觉 +1
视觉Transformer实战 | Vision Transformer(ViT)详解与实现

在计算机视觉领域,卷积神经网络 (CNN) 长期以来一直是处理图像任务的主流架构。然而,随着 Transformer 在自然语言处理领域的巨大成功,研究人员开始探索将这种基于自注意力机制的架构应用于视觉任务。Vision Transformer (ViT) 是这一探索的重要里程碑,它首次证明了纯 Transformer 架构在图像分类任务上可以超越最先进的 CNN 模型。本文将详细介绍 ViT 的

文章图片
#transformer#深度学习#人工智能
深度学习常用性能评价指标

深度学习性能指标是用于评价深度学习模型性能的依据,是设计模型的重要依据。

文章图片
#深度学习#神经网络#机器学习 +2
Python图片文字识别——Windows下Tesseract-OCR的安装与使用

Tesseract是一个开源 OCR 引擎,可以直接通过命令行使用,或者通过使用API从图像中提取文本。它为多种语言提供了API,其中显然包括Python。Tesseract支持unicode (UTF-8),可以识别 100 多种语言。Tesseract支持各种输出格式,包括纯文本、HTML、PDF、TSV等。本文介绍了Windows下Tesseract的安装和如何通过Python调用Tesse

文章图片
#python#人工智能#数据分析
深度卷积生成对抗网络(DCGAN)原理与实现(采用Tensorflow2.x)

Ian Goodfellow 在首次提出GAN,使用了形象的比喻来介绍 GAN 模型:生成网络 G 的功能就是产生逼真的假钞试图欺骗鉴别器 D,鉴别器 D 通过学习真钞和生成器 G 生成的假钞来掌握钞票的鉴别方法。这两个网络在相互博弈中进行训练,直到生成器 G 产生的假钞使鉴别器 D 难以分辨。而DCGAN是使用卷积操作和反卷积操作来替代原始GAN中的全连接操作。

#tensorflow#机器学习#深度学习 +1
多模态大模型时代下的文档图像智能分析与处理

随着人工智能技术的不断发展,尤其是深度学习技术的广泛应用,多模态数据处理和大模型训练已成为当下研究的热点之一,这些技术也为文档图像智能处理和分析领域带来了新的发展机遇。在本节中,回顾来自中科院自动化研究所、北京大学、中科大的学术专家与合合信息等知名企业的研究者在中国图形图像大会 (CCIG 2023) 关于文档图像分析与处理的相关分享,介绍在多模态大模型时代下文档图像智能分析与处理技术的最新进展和

文章图片
#人工智能#机器学习#计算机视觉
    共 104 条
  • 1
  • 2
  • 3
  • 11
  • 请选择