logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

使用CUDA的PyTorch进行张量重整化的gpu加速

作者展示了基于张量重整化群(TRG)方法的数值计算可以通过利用NVIDIA的计算统一设备架构(CUDA)在图形处理单元(GPU)上的PyTorch显著加速。作者发现,在二维系统中,对于给定的精度,运行时间以及与边界维度的扩展都得到了改进。作者的结果表明,在未来的高精度TRG计算中,利用GPU资源是至关重要的。

#深度学习#人工智能
基于边界感知上下文神经网络的医学图像分割

医学图像分割可以为进一步的临床分析和疾病诊断提供可靠的依据。随着卷积神经网络(CNN)的发展,医学图像分割性能有了显著的提高。然而,大多数现有的基于CNN的方法往往产生不令人满意的分割掩模没有准确的对象边界。这个问题是由有限的上下文信息和连续池化和卷积操作后的不充分的区分特征映射引起的。此外,医学图像的特点是高类内变化,类间不区分和噪声,提取强大的上下文和聚合的细粒度分割的区别性特征仍然具有挑战性

#神经网络#人工智能#深度学习
DoubleU-Net:一种用于医学图像分割的深度卷积神经网络

语义图像分割是将图像中的每个像素标记为相应的类的过程。基于编码器-解码器的方法,如U-Net及其变体,是解决医学图像分割任务的流行策略。为了提高U-Net在各种分割任务上的性能,我们提出了一种名为DoubleU-Net的新架构,它是两个U-Net架构相互堆叠的组合。第一个U-Net使用预训练的VGG-19作为编码器,它已经从ImageNet中学习了特征,可以轻松地转移到另一个任务中。为了有效地捕获

#cnn#人工智能#神经网络
人脸识别的经典深度学习方法

基于深度学习的人脸识别方法通常包括两个步骤:首先使用一个深度神经网络模型提取人脸图像的特征向量,然后使用一种距离度量方法(如欧氏距离、余弦相似度等)来比较特征向量之间的相似度,从而实现人脸识别。例如,使用CNN模型进行端到端的人脸检测,可以直接从原始图像中提取人脸区域,避免了手工设计特征的过程,提高了检测的准确率和鲁棒性。基于特征点的对齐方法通过检测人脸图像中的关键特征点(如眼睛、鼻子、嘴巴等),

#深度学习#人工智能
深度学习的发展历史与关键技术

在未来,随着计算机算力的增强、数据规模的扩大以及算法的不断优化,深度学习技术将会在更多领域展现出强大的应用潜力,为人类社会带来更多的便利与进步。它由一个输入层和一个输出层组成,其中每个输入都与输出层的每个神经元相连,具有一定的权重。感知机的输出是输入的加权和经过阈值函数的结果。本文将介绍深度学习的发展历史,从早期的感知机到如今的深度神经网络,同时介绍深度学习中的一些关键技术和公式。反向传播算法是用

#深度学习#人工智能
2022-MIA:基于边界感知上下文神经网络的医学图像分割Boundary-aware context neural network for medical image segmentation

医学图像分割可以为进一步的临床分析和疾病诊断提供可靠的依据。随着卷积神经网络(CNN)的发展,医学图像分割性能有了显著的提高。然而,大多数现有的基于CNN的方法往往产生不令人满意的分割掩模没有准确的对象边界。这个问题是由有限的上下文信息和连续池化和卷积操作后的不充分的区分特征映射引起的。此外,医学图像的特点是高类内变化,类间不区分和噪声,提取强大的上下文和聚合的细粒度分割的区别性特征仍然具有挑战性

#神经网络#人工智能#深度学习
MambaDFuse:一种基于mamba的多模态图像融合双相位模型

多模态图像融合(MMIF)旨在将来自不同模态的互补信息整合到单一的融合图像中,以全面地表征成像场景并促进下游视觉任务的完成。近年来,由于深度神经网络的进步,在MMIF任务上取得了显著的进展。然而,现有方法受到固有的局部还原性偏差(CNN)或二次计算复杂度(Transformers)的限制,无法有效且高效地提取模态特定和模态融合特征。为了克服这个问题,作者提出了一个基于Mamba的双阶段融合(Mam

#人工智能#深度学习
Sigma:用于多模态语义分割的Mamba网络

多模态语义分割显著提高了AI代理在不利条件下的感知和场景理解能力,尤其是在低光或过度曝光的环境中。利用热成像和深度等额外模态(X模态)与传统RGB数据相结合,提供了互补信息,使得分割更加健壮和可靠。在这项工作中,作者介绍了Sigma,一个用于多模态语义分割的暹罗眼镜蛇网络,它采用了选择性结构化状态空间模型Mamba。与依赖于局部感受野有限的CNN或以二次复杂度为代价提供全局感受野的视觉 Trans

#人工智能
FusionMamba:动态特征增强与曼巴的多模态图像融合

多模态图像融合旨在从不同的模态中整合信息,以创建具有全面信息和详细纹理的单张图像。然而,基于卷积神经网络融合模型在捕捉全局图像特征方面存在局限性,这是由于它们侧重于局部卷积操作。尽管基于Transformer的模型在全球特征建模方面表现出色,但它们却面临着由二次复杂度引起的计算挑战。近期,选择性的结构化状态空间模型显示出在具有线性复杂度的情况下建模长距离依赖关系的显著潜力,这为解决前述困境提供了一

#计算机视觉#深度学习#人工智能
Matten:视频生成与Mamba-Attention

在本文中,作者介绍了Matten,一种具有Mamba-Attention架构的尖端潜在扩散模型,用于视频生成。在极小的计算成本下,Matten利用空间-时间注意力对局部视频内容进行建模,并使用双向Mamba对全局视频内容进行建模。作者的全面实验评估表明,Matten在基准性能上与当前的基于Transformer和GAN的模型具有竞争力,实现了更优的FVD得分和效率。此外,作者观察到作者设计的模型复

#音视频
    共 52 条
  • 1
  • 2
  • 3
  • 6
  • 请选择