
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
AAAI 2025 | SpikingYOLOX:结合快速傅里叶卷积和脉冲神经网络的改进型YOLOX目标检测
(1)Conv-SignedIF层:仅保留 1×1 卷积,将原生 CSPNet 的 SiLU 激活替换为SignedIF(三值符号脉冲神经元),用 SNN 的事件驱动稀疏计算,替代 ANN 的连续值计算,大幅降低该分支的计算量和功耗。YOLOX 的经典预处理模块(将输入图像按像素间隔拆分,再沿通道维度拼接,将空间维度信息转换为通道维度),替代传统下采样卷积,在不损失信息的前提下完成图像下采样,减少

CVPR 2025 | ROD-MLLM:迈向更可靠的多模态大型语言模型中的目标检测
现有 MLLM(多模态大语言模型) 仅能定位图像中已存在的单个目标,无法处理多目标与不存在目标场景,易产生错误匹配。我们提出ROD-MLLM模型,用于自由语言下的可靠目标检测:1.提出基于查询的定位机制提取低层目标特征,将全局与区域视觉信息对齐到文本空间,由大型语言模型完成高层理解与最终定位决策;2.设计自动化数据标注流程,构建ROD 数据集,解决训练数据稀缺问题;3.实验表明,模型在指代、定位、

到底了







