logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

KAN Kolmogorov–Arnold Networks 网络详细介绍及代码复现

KAN 模型受 Kolmogorov-Arnold 表示定理的启发提出,作为多层感知机(MLP)的一种替代方案。与 MLP 固定激活函数的位置不同,KAN 将可学习的激活函数放置在网络的边缘(weights)上,完全摒弃了线性权重矩阵。通过这种设计,KAN 可以提高准确性和模型解释性。

文章图片
#人工智能#神经网络
[2025CVPR-目标检测方向] CorrBEV:多视图3D物体检测

本文提出CorrBEV框架,针对自动驾驶中多视图3D物体检测的遮挡问题,通过引入视觉和语言原型作为先验知识来补偿特征损失。该即插即用框架包含多模态原型生成器、相关引导查询学习器和遮挡感知训练器,采用深度相关操作实现高效知识融合。实验表明,CorrBEV在nuScenes数据集上显著提升基准模型性能(BEVFormer提升2.6%mAP),尤其对低可见性物体召回率提升8.7%,同时增强雪天等恶劣场景

文章图片
#目标检测#3d#人工智能 +3
[2025CVPR-目标检测方向]FSHNet:一种用于3D物体检测的全稀疏混合网络。

FSHNet是一种创新的全稀疏混合网络,用于解决3D物体检测中的长距离交互弱和中心特征缺失问题。该网络结合稀疏卷积的高效性和注意力机制的全局交互能力,通过SlotFormer块实现无限长距离交互,采用动态稀疏标签分配优化训练,并引入稀疏上采样模块增强细节。在Waymo、nuScenes和Argoverse2数据集上均达到SOTA性能,显著提升了大物体和小物体的检测精度。

文章图片
#目标检测#3d#人工智能 +4
基于卷积傅里叶分析网络 (CFAN)的心电图分类的统一时频方法

本研究提出CFAN架构,创新性地将傅里叶分析嵌入卷积层,通过CONV-FAN模块(含独立权重的正弦/余弦/GELU混合激活)实现端到端时频特征融合。在MIT-BIH(98.95%)、ECG-ID(96.83%)和Apnea-ECG(95.01%)三个ECG分类任务上均超越传统方法(SPECT/CNN1D/FFT1D),验证了周期性激活函数对生物医学信号的有效性。相比频谱图转换方法,CFAN避免了信

文章图片
#傅立叶分析#分类#数据挖掘 +4
YOLO-SM模型详解及代码复现

定义网络结构,如骨干网络、特征金字塔等。

文章图片
#人工智能#深度学习#python +3
Relation-DETR模型详解及代码复现

采用二分图匹配损失(匈牙利算法)组合分类损失(交叉熵)和回归损失(L1+GIoU)

文章图片
#算法#人工智能#深度学习 +3
SegMAN模型详解及代码复现

特别是LASS混合模块的创新设计,为模型在处理复杂变形和多尺度目标时提供了独特的优势,使得SegMAN在语义分割基准测试中表现出卓越的性能。这种设计突破了传统Transformer的二次方复杂度限制,通过Natten的局部窗口约束和SS2D的状态空间压缩策略,在保持线性计算复杂度的同时,实现了多尺度特征的协同优化。这种设计突破了传统Transformer的二次方复杂度限制,通过Natten的局部窗

文章图片
#深度学习#机器学习#计算机视觉 +4
基于特征工程(pca分析)、小波去噪以及数据增强,同时采用基于注意力机制的BiLSTM、随机森林、ARIMA模型进行序列数据预测

本文采用特征工程(pca分析)、小波去噪以及数据增强,同时采用基于注意力机制的BiLSTM、随机森林、ARIMA模型进行序列数据预测基于BILSTM(双向长短期记忆网络)、随机森林回归和ARIMA(自回归积分滑动平均)模型的序列数据预测是一种综合运用多种机器学习和统计方法的预测策略。这种方法结合了BILSTM在处理长序列数据时的优势、随机森林在处理非线性关系时的能力以及ARIMA在处理时间序列数据

文章图片
#深度学习#神经网络#人工智能 +3
立体注意力机制(SAM)详解及代码复现

立体注意力机制(Stereo Attention Mechanism, SAM)是一种在计算机视觉领域中广泛应用的先进技术,旨在模拟人类视觉系统的选择性注意力机制。它通过动态地聚焦于图像或点云数据中的关键区域,有效提高了模型对复杂场景的理解和处理能力。

文章图片
#深度学习#人工智能#算法 +2
到底了