logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

ICPR 2024 | 资源受限下的红外小目标检测挑战赛

关注公众号,发现CV技术之美ICPR 2024是国际模式识别会议,由国际模式识别协会(The International Association for Pattern Recognition, IAPR)主办,ALPCORD NETWORK活动和会议管理公司(ALPCORD NETWORK event &conference management company, ALPCORD NET

#目标检测#人工智能#计算机视觉
CVPR 2024 | 腾讯优图实验室20篇论文入选,含图文多模态大模型、高分辨视觉分割、跨模态生成、人脸识别等研究方向...

关注公众号,发现CV技术之美近日,CVPR 2024 (IEEE Conference on Computer Vision and Pattern Recognition) IEEE国际计算机视觉与模式识别会议公布了论文录用结果。作为全球计算机视觉与模式识别领域的顶级会议,CVPR每年都吸引着全球众多研究者和企业的关注。入选CVPR的论文需要经过严格的评审流程,确保其创新性和实用性达到国际领先水

综述 | 缺陷检测算法(传统+深度学习方式)

在计算机视觉领域,目标检测发展迅速,出现了基于机器视觉技术的表面缺陷检测技术。这种技术的出现,越来越多的制造企业正在尝试将机器视觉检测技术引入产品缺陷检测。目前基于机器视觉的缺陷检测技术已经大量应用于纺织品、汽车零部件、半导体、光伏组件等产品的缺陷检测中,大大提升了制造业的质检效率。机器视觉在工业缺陷检测中的前景毋庸置疑,而工业制造领域的多样性、生产环境的复杂性、产品缺陷...

#神经网络#人工智能#深度学习 +2
华科&华为发布首款基于国产芯片适配的多模态大模型“PDF悟空”,解析长文档多模态数据能力 SOTA...

关注公众号,发现CV技术之美2024年10月,华中科技大学白翔团队与华为研究人员合作,推出了基于国产芯片的多模态文档大模型PDF-WuKong。这一创新成果针对复杂多页PDF文档问答场景,提出了两项关键技术:端到端稀疏采样机制和多页PDF问答高质量数据生成方法。这些技术突破使得输入长度有限的多模态大模型能够有效处理理论上无限长的PDF文档,实现深度理解和精准问答。PDF-WuKong不仅解决了现有

​ICPR 2024第二届卫星视频运动目标检测与跟踪挑战赛正式开赛

关注公众号,发现CV技术之美ICPR 2024:The 2st Challenge on Moving Object Detection and Tracking in Satellite Videos第二届卫星视频运动目标检测与跟踪挑战赛(The 2st Challenge on Moving Object Detection and Tracking in Satellite Videos)将

#目标检测#目标跟踪#人工智能 +2
天津大学推出大型无人机航拍车辆数据集DroneVehicle

点击我爱计算机视觉标星,更快获取CVML新技术无人机已经越来越走入人们的生产和生活,使用无人机进行新闻报道、城市管理、治理监控也成为社会发展重要新趋势。我在南京的报纸上就看到过南京市对拟...

从人脸识别到内容审核,百度硬核AI技术推荐!

对于AI行业从业人员来说,如何快速、低成本打造成熟的AI产品?是不是面对一个新问题,先查找文献然后从头开始复现论文?不不不!最近的路径是,先使用业界的优秀技术打通路径,让业务跑起来!而百...

#百度#人工智能#大数据 +2
CV Code | 计算机视觉开源周报 20190505期

点击我爱计算机视觉标星,更快获取CVML新技术今天正式将每周末盘点计算机视觉开源代码的环节,改名为计算机视觉开源周报,并为此编排了期号,希望把这个栏目坚持做下去,方便以后期数多了之后大家...

TPAMI 2025 | 国防科大提出RGBT-Tiny数据集与SAFit指标,推动小目标检测技术发展

现有数据集多聚焦单一模态(可见光或红外成像),且目标尺寸偏大、场景单一,难以满足实际需求,针对可见光-红外双模态(Visible-Thermal, RGBT)小目标检测的研究却鲜有突破。在无人机监控、自动驾驶、夜间搜救等场景中,小目标检测(如远处行人、微型无人机)一直是技术难点——目标尺寸小、背景干扰多、光照条件复杂。115组对齐序列、9.3万帧图像、120万标注,覆盖7类目标(如船舶、汽车、行人

#目标检测#目标跟踪#人工智能 +2
中科大腾讯发布首篇《多模态大语言模型综述》

关注公众号,发现CV技术之美项目链接(实时更新最新论文,已获1.8K Stars):https://github.com/BradyFU/Awesome-Multimodal-Large-Language-Models近来,多模态大语言模型(Multimodal Large Language Model,MLLM)受到广泛关注,成为一个新兴的研究热点。MLLM通常以大语言模型(Large Lang

#语言模型#人工智能#自然语言处理
    共 651 条
  • 1
  • 2
  • 3
  • 66
  • 请选择