雷阵雨yy 个人主页

@2501_93976498

雷阵雨yy

2025-12-13 09:25:16 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

AAAI 2025 | SpikingYOLOX：结合快速傅里叶卷积和脉冲神经网络的改进型YOLOX目标检测

（1）Conv-SignedIF层：仅保留 1×1 卷积，将原生 CSPNet 的 SiLU 激活替换为SignedIF（三值符号脉冲神经元），用 SNN 的事件驱动稀疏计算，替代 ANN 的连续值计算，大幅降低该分支的计算量和功耗。YOLOX 的经典预处理模块（将输入图像按像素间隔拆分，再沿通道维度拼接，将空间维度信息转换为通道维度），替代传统下采样卷积，在不损失信息的前提下完成图像下采样，减少

#神经网络 #目标检测 #目标跟踪

CVPR 2025 | ROD-MLLM：迈向更可靠的多模态大型语言模型中的目标检测

现有 MLLM（多模态大语言模型）仅能定位图像中已存在的单个目标，无法处理多目标与不存在目标场景，易产生错误匹配。我们提出ROD-MLLM模型，用于自由语言下的可靠目标检测：1.提出基于查询的定位机制提取低层目标特征，将全局与区域视觉信息对齐到文本空间，由大型语言模型完成高层理解与最终定位决策；2.设计自动化数据标注流程，构建ROD 数据集，解决训练数据稀缺问题；3.实验表明，模型在指代、定位、

#语言模型 #目标检测 #目标跟踪

到底了