logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

CVPR 2025 Workshop | 面向多模态大模型的越狱攻击安全挑战赛

然而,这张图片和文本中添加了针对大模型特别设计的对抗扰动,绕过了多模态大模型的安全限制,诱导大模型产生违反其设计初衷或安全准则的输出。但与初赛不同的是,复赛的待攻击模型将额外引入1个黑盒大模型,并引入6种更具有挑战性的风险类别的基础有害文本指令,对于所设计对抗攻击算法的迁移性与鲁棒性有着更高的要求。像这种直接在多模态大模型的图文对输入中增加相关扰动,使多模态大模型产生违规输出的攻击手段,就是对多模

#安全#网络
思路打开,换个方式解决算力和数据问题

算力和数据问题着实让很多开发人员困扰,尤其在大模型背景下,日益庞大的数据、算力需求和有限的预算形成鲜明的矛盾。此处来分享两个方案的思路,希望有所启发。>> 破解计算机视觉的数据集问题:AIGC合成数据生成方案计算机视觉 AI 应用的模型训练数据集要求较高。真实世界的数据往往无法完全获取到泛化AI模型所需要的所有可能场景和边缘案例,而且涉及到数据隐私、数据质量、数据存量等问题,获得这些数

#人工智能
牛津光计算论文登Nature正刊,分析帕金森患者步态准确率达92.2%

关注公众号,发现CV技术之美本文转载机器之心。本文第一作者为牛津大学 Harish Bhaskaran 院士课题组董博维博士。Harish Bhaskaran 院士课题组的多名科研人员 2022 年在国内联合创立光计算芯片公司光本位科技,该公司在今年7月份的世界人工智能大会上宣布所研发的 128*128 矩阵规模光计算芯片算力密度和算力精度达到商用标准,董博维博士目前已与该公司建立合作关系,从光源

CVPR 2025 最佳论文候选揭晓:3D领域强势领跑,独占近半数席位

基于此,提出了一种新的混合模型,采用灵活的Student's t分布,并引入了正密度(点积,splatting)和负密度(挖掘,scooping)两种操作。本文提出了一种导航世界模型(Navigation World Model,简称NWM),这是一种可控的视频生成模型,能够基于过去的视觉观测和导航动作预测未来的视觉观测。与传统在单一任务上进行专门设计的3D视觉模型相比,VGGT是一种更简洁高效的

#3d
北大&清华推出RT-DETRv4:大模型甘当陪练,实时检测器性能免费再升级!

可以看到,一个强大的VFM(如DINOv3)作为“教师”,将其提取的高质量语义特征,通过DSI模块“注入”到实时检测器(学生)的深层特征中。对比上(基线模型)下(RT-DETRv4)两行特征图,可以清晰地看到,经过DSI模块增强后,无论是AIFI的输出F5,还是后续融合的特征P3, P4, P5,物体轮廓都更清晰,背景干扰更少,语义表征质量得到了肉眼可见的提升。CV君认为,RT-DETRv4提出的

#目标跟踪#人工智能#计算机视觉 +1
ICML2025 | 细粒度图文对齐突破,360人工智能研究院发布全新一代图文跨模态模型FG-CLIP,开源并可商用

当前普遍使用的图文跨模态模型如OpenAI CLIP,EVA-CLIP等,仍是基于第一代的整体图文对比学习算法训练得到,它们擅长捕捉全局信息,却难以分辨物体的细微属性差异,在处理细粒度视觉理解时面临非常大的挑战。例如,区分“一只黑色的狗”与“一只深棕色的狗”,或识别“陶瓷茶杯”与“玻璃茶杯”的材质差异,往往会让模型陷入困惑。视觉与语言的跨模态理解是大模型时代众多关键技术与业务应用的核心基石,如多模

#人工智能
博士招生 | 西湖大学人工智能与生物医学影像实验室招募,多模态大模型方向

实验室负责人杨林博士现任西湖大学终身教授(Tenured Professor),近年来在Nature Machine Intelligence、Nature Medicine、TPAMI等国际期刊及CVPR、MICCAI、ECCV、ICLR等顶级会议论文集上发表科研论文一百余篇,引用次数已达一万余次,曾获MICCAI会议青年科学家奖项(Young Scientist Award)及MICCAI会议

#人工智能
Imec 招聘博士后研究人员,高性能计算的人工智能研究

关注公众号,获取更多AI领域发展机会公司介绍Imec 是世界领先的纳米电子和数字技术的研究和创新中心。在微芯片技术领域广受赞誉的领导地位与深厚的软件和信息通信技术专业知识相结合,是Imec 的独特之处。通过利用世界一流的基础设施和跨越众多行业的本地及全球合作伙伴生态系统,在医疗保健、智能城市和移动性、物流和制造以及能源等应用领域创造了突破性的创新。作为企业、初创企业和大学值得信赖的合作伙伴,Ime

#人工智能#大数据#物联网
25-50K,梅卡曼德机器人招聘,C++、嵌入式、FPGA方向

关注公众号,获取更多AI领域发展机会公司介绍梅卡曼德机器人由清华海归团队于2016年创办,致力于推动智能机器人无所不在的存在,总部位于北京和上海,在深圳、长沙、青岛、慕尼黑、东京等地有布局。公司特点:清华海归团队创办,技术为本,高层次人才队伍知名投资机构支持,全球AI+工业机器人领域融资额最高之一技术能力全面、掌握核心器件,生产和交付能力强全球化布局,已在全球各领域有10...

#c++#嵌入式#java +2
GPU算力新平台亮相不语,只一味豪撒福利,GpuGeek到底藏着什么大招?

关注公众号,发现CV技术之美又一GPU云平台火热上新!GpuGeek,一个面向算法工程师的AI infra平台,为用户提供一站式GPU算力、对象存储、NAS存储、云盘、开发工具、模型部署等能力,专注模型研发和微调,致力于让用户的创意落地,并更顺利地训练AI大模型。01 了解GpuGeek,立即上手!GpuGeek为算法工程师们提供弹性、易用、灵活的底层技术服务,用户可以在PC端直接租用GPU。目前

    共 766 条
  • 1
  • 2
  • 3
  • 77
  • 请选择