logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

大模型时代,为什么工业界还在疯狂用 YOLO?算完这笔账,我沉默了

咱们搞算法的都知道,以前的模型( 比如 YOLOv8/11)在“看”图时,会生成成千上万个重叠的候选框,然后用非极大值抑制(NMS)过滤掉多余的框。比如,我们用云端那个牛逼但昂贵的 GPT 去自动标注海量数据,教出轻量级、反应快的 YOLO26,然后把学生派到世界各地的摄像头里去干活。它融合了传统 SGD 的稳定性和大模型训练的一些优化思路,能让模型收敛得更快、更稳,尤其在处理复杂数据集时,调参的

TPAMI 2025 重磅|CLRNetV2:让自动驾驶 “看清” 密集车道与极端路况的全能检测框架

这个由浙江大学等机构研发的全新车道检测框架,就像给自动驾驶装上了"火眼金睛",不仅看得准,还跑得飞快!《从 0 入门人工智能学习攻略手册》文档,包含视频课件、习题、电子书、代码、数据等人工智能学习相关资源,可以下载离线学习。看下面的对比就知道效果多明显:用传统损失预测的车道线歪歪扭扭,而Line IoU损失能输出更贴合真实的平滑曲线。图像分割、口罩检测、车道线检测、车辆计数、添加眼线、车牌识别、字

#自动驾驶#人工智能#机器学习
TPAMI 2025 傅里叶残差引导+两阶段映射:DA-RCOT重构统一图像复原范式

这项发表在TPAMI 2025的研究,用数学中的"最优传输"思想解决图像复原难题,让一个模型就能搞定多种退化问题,还能完美保留图像细节!你是否遇到过这样的困扰:一张照片可能同时被噪声、雨雾、模糊等多种问题缠身,而普通的修复工具要么只能处理单一问题,要么修复后画面变得模糊不清?简单说,就是找到一种"最优运输方案",把退化图像的像素"搬运"到干净图像的对应位置,同时保证"运输成本"最低。图像分割、口罩

#重构
TPAMI 2025 | SDNet-A 融合注意力与多尺度对比特征编码,实现轻量级显著目标检测精度突破

近期,Zhuo Su等学者提出的SDNet/STDNet模型,凭借像素差分卷积(PDC)和差分卷积重参数化(DCR)等核心创新,在参数量不足1M的前提下,实现了图像/视频显著目标检测的极致效率与精度平衡:在Jetson AGX Orin嵌入式设备上,图像检测速度达46 FPS,视频检测更是突破150 FPS,远超同类轻量模型,同时保持顶尖检测精度。此外,STDC还借鉴了LBP-TOP的设计思想,但

#目标检测#人工智能#计算机视觉
苏炳添获批社科基金项目!苏神都逃不脱高校考核了?

(1989年8月29日—),广东省中山市人,中国退役田径运动员、暨南大学体育学院院长、教授、中国田径协会执委会副主席,主项短跑,亚洲男子田径60米及100米纪录保持者。《从 0 入门人工智能学习攻略手册》文档,包含视频课件、习题、电子书、代码、数据等人工智能学习相关资源,可以下载离线学习。图像分割、口罩检测、车道线检测、车辆计数、添加眼线、车牌识别、字符识别、情绪检测、文本内容提取、面部识别。扩展

TPAMI 2025 | 强化学习驱动自动选样,持续语义分割记忆利用再升级

首先把图像的语义区域拆分成多个超像素(每个超像素代表一个有意义的语义结构,比如鸟的头部、汽车的轮子),每个超像素对应图中的一个顶点,顶点特征是超像素内所有像素的平均骨干特征;但研究团队发现,即便是最优候选样本,其分数也未必理想,因此又增加了“样本增强”步骤:通过梯度更新的方式优化样本,提升其智能体分数,让这些样本在后续重放中发挥更大作用。最后用最优传输算法进行图匹配,得到的匹配成本就能精准反映两张

【IEEE计算机会议盘点】2026年上半年好投EI会议推荐:计算机视觉、区块链、算法、人工智能、大数据等主题火热征稿中!

SPIE出版| 2026年机器视觉、检测与三维成像技术国际学术会议(MVDIT 2026)IEEE出版 | 2026年计算智能与机器学习国际学术会议(CIML 2026)IEEE出版 | 2026年智能感知与自主控制国际学术会议(IPAC 2026)IEEE出版|2026年区块链技术与基础模型国际学术会议(BTFM 2026)2026年计算力学与智能系统国际学术会议(CMSS 2026)2026年

#人工智能#计算机视觉#区块链 +1
谁是2025年度最好的编程语言?

越来越多的程序员选择Python,并基于它开发了各类工具,在开源社区贡献了海量的代码和解决方案,逐渐构建出属于Python的生态护城河。他们会因为你没有提前搜索过而指责你,让你觉得自己很蠢,而且大多数时候,他们只是瞥一眼就走开了,根本不会帮你。不过,SQL的处境依然比JavaScript安全得多。无论是老手借助AI处理繁琐的任务,还是新手尝试编写完整的Web应用,AI的介入让程序员逐渐摆脱对编程细

强化学习这么做绝绝子!最新idea登顶Nature正刊&Science!

STORM结合了Transformer的强大序列建模和生成能力以及变分自编码器(VAE)的随机性,通过在Atari 100k基准测试中实现126.7%的人类平均性能,刷新了不使用前瞻搜索技术的最先进方法的记录。这篇文章提出了一种名为 UaMB-SF的强化学习框架,旨在通过结合模型基(MB)方法和后继特征(SF)方法,实现跨任务的知识迁移和样本高效的学习。该方法通过构建一个包含12万个人类标注的偏好

    共 1602 条
  • 1
  • 2
  • 3
  • 161
  • 请选择