logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Deformable Mamba:广角图像分割新思路

在计算机视觉的密集预测任务(如语义分割)中,状态空间模型(SSM,如 Mamba)凭借其线性的计算复杂度,正逐渐成为 Transformer 的有力竞争者。然而,当我们把目光从标准的针孔相机转向广角相机(如 180° 鱼眼或 360° 全景)时,现有的视觉 Mamba 模型往往会出现问题。本文将深度解析发表于 2025 年的一篇具有工程实用价值的论文——。作者提出了一种轻量级的。它不仅将参数量和计

文章图片
#人工智能
MedSegDiff:基于扩散模型的医学图像分割

本文系统分析了两代基于扩散模型的医学图像分割方法:MedSegDiff和MedSegDiff-V2。MedSegDiff首次将去噪扩散概率模型(DPM)应用于医学图像分割,通过动态条件编码和FF-Parser模块解决了病灶边界模糊问题。MedSegDiff-V2则创新性地将Transformer与扩散模型结合,提出锚点条件和频谱空间Transformer架构,在20项任务中刷新性能记录,同时显著提

文章图片
#人工智能
【IEEE TNNLS 2025】赋予大模型“跨院行医”的能力:基于全局与局部提示的医学图像泛化框架 (GLP) 解析

在医学图像分割的临床落地中,一个长期存在的痛点是**“领域偏移 (Domain Shift)”**。一个在A医院(源域)表现完美的深度学习模型,当部署到使用不同成像设备、不同扫描参数的B医院(未知目标域)时,往往会遭遇性能的断崖式下跌。如图1所示,同样的糖尿病视网膜病变影像由于不同的拍摄设备展示出来的效果完全不同,虽然从分割mask的结果看,眼球结构类似。近年来,大视觉模型(PVM,如 Visio

文章图片
#人工智能
[AAAI2026]结合方向先验与空频联合域的医学图像分割解码器

在医学图像分割任务中,经典的 U-Net 及其衍生架构(如各种 Vision Transformer 变体)在全局上下文建模上已经取得了显著进展。然而,现有模型在处理极其微小的边缘细节、局部复杂纹理以及保持空间连续性时,依然存在瓶颈。特别是传统的跳跃连接(Skip Connections)往往采用简单的加法或拼接,容易将编码器中的背景噪声和冗余特征直接带入解码阶段。

文章图片
#人工智能
【已解决】Ubuntu18.04下NVIDIA GPU驱动程序运行一段时间后出错“NVIDIA-SMI has failed”

          本人在使用Ubuntu18.04 NVIDIA GPU深度学习环境的过程中,每过一段时间就出现错误“NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and runni

Ubuntu18.04下搭建深度学习环境(tensorflow CPU GPU、Keras、Pytorch、Pycharm、Jupyter)

     以前一直都是在Windows上玩CPU版的Tensorflow,现在有时间弄一下,买了一根16GB的内存条扩容上。以前是Win10+Ubuntu双系统,以前的Ubuntu上由于做实验有一堆的错误待解决,现在懒得折腾了,直接装成Ubuntu单系统。我的电脑配置如下:CPU:Intel Core i7-7770HQ内存:24GB显卡:NVIDIA 940MX硬盘:128GBS...

CNN注意力机制的进化史:深度解析10种注意力模块如何重塑卷积神经网络

从SE到SSCA,注意力机制正从"单一增强"走向"协同进化"。下一个突破点会是动态可重构的注意力吗?让我们共同见证深度学习的新篇章!

文章图片
#cnn#人工智能#神经网络
PlotNeuralNet-一款绘制神经网络的好工具

        今天发现github上一款绘制神经网络的好工具,项目名称:PlotNeuralNet,clone下来试了一下,效果很好,目前主要支持的是卷积神经网络,卷积层、池化层、bottleneck、skip-connection、up-conv、Softmax等常规的层在代码中都有定义,还缺少RNN相关的可视化层展示,未来作者可能会补上。这里简单记录一下,分享给写论文插图不好绘制的朋友。..

[Nature 2026]AFLoc:一种用于通用无标注病理局部定位的多模态视觉‑语言模型

AFLoc:基于多模态对齐的医疗影像无监督病灶定位方法 摘要:Nature最新发表的AFLoc模型创新性地通过多层级语义对齐技术,实现了无需人工标注的医疗影像病灶定位。该模型将医学影像的局部特征与临床报告文本进行三级对齐(单词级、句子级、报告级),在胸部X光、眼底图像等多种模态上展现出卓越的跨场景泛化能力。实验证明,AFLoc不仅超越了现有自监督方法的定位精度,还能显著提升临床诊断效率(准确率+8

文章图片
#语言模型#人工智能#深度学习
【论文阅读笔记】Sam3d: Segment anything model in volumetric medical images[

与传统的逐层处理不同,SAM3D能够在整个体积上处理图像,更有效地捕捉切片间的深度关系,同时维持模型的简单性和计算效率。:通过在多个医学图像数据集上的实验,只需要单2080TI GPU,SAM3D显示了与当前最先进的3D神经网络和基于Transformer的模型相当的性能(其实弱很多),同时在参数数量上大大减少。去除了SAM中的prompts Encoder:因为解码器必须处理 3D 体积数据,所

文章图片
#论文阅读
    共 66 条
  • 1
  • 2
  • 3
  • 7
  • 请选择