logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

AI生成未来 | 铁钉水上漂、子弹穿苹果不炸?Nano-Banana等17款SOTA模型颤抖迎物理逻辑推理大考!

《PicWorld:首个评估文生图模型隐含推理能力的基准》摘要 美团MeiGen团队提出PicWorld基准,首次系统性评估文本到图像模型对隐含世界知识(物理定律、逻辑推理)的理解能力。该基准包含1,100个提示词,涵盖物理世界、抽象知识和逻辑推理三大领域。研究团队开发了PW-Agent评估框架,通过多智能体协作实现分层精细化评估,包括知识提取、假设构建、视觉感知和推理评判四个模块。实验测试了17

文章图片
#人工智能#深度学习#目标检测 +3
AI生成未来 | 铁钉水上漂、子弹穿苹果不炸?Nano-Banana等17款SOTA模型颤抖迎物理逻辑推理大考!

《PicWorld:首个评估文生图模型隐含推理能力的基准》摘要 美团MeiGen团队提出PicWorld基准,首次系统性评估文本到图像模型对隐含世界知识(物理定律、逻辑推理)的理解能力。该基准包含1,100个提示词,涵盖物理世界、抽象知识和逻辑推理三大领域。研究团队开发了PW-Agent评估框架,通过多智能体协作实现分层精细化评估,包括知识提取、假设构建、视觉感知和推理评判四个模块。实验测试了17

文章图片
#人工智能#深度学习#目标检测 +3
Zilliz | 语义+R-Tree空间索引:Milvus如何帮外卖APP做3公里内美食推荐| Milvus Week

Milvus 2.6创新性地将地理空间数据与向量检索融合,通过引入Geometry数据类型和R-Tree空间索引,实现空间+语义的联合检索。这一突破使AI应用(如本地生活推荐、自动驾驶)能同时理解语义和空间关系,显著提升决策效率。例如外卖平台可一次性检索"3公里内口味相似的餐厅",自动驾驶系统能快速判断车辆位置与障碍物关系。该技术解决了传统方案中地理数据与向量数据割裂的问题,为

文章图片
#milvus#美食#计算机视觉 +3
极市平台 | NeurlPS‘25开源 | 中科院新作AutoSeg3D:在线分割一切3D物体,超越ESAM!

本文提出AutoSeg3D,将在线3D分割重构为实例跟踪问题,通过长-短期记忆查询流统一维护对象ID与特征。该方法采用三个协同模块:长期记忆(LTM)实现跨帧ID匹配,短期记忆(STM)注入时间上下文,空间一致性学习(SCL)抑制视觉基础模型的过分割问题。实验表明,在ScanNet200上比ESAM提升2.8AP,同时在ScanNet、SceneNN和3RScan数据集上保持优异性能,且具备实时处

文章图片
#3d#人工智能#计算机视觉 +4
极市平台 | NeurlPS‘25开源 | 中科院新作AutoSeg3D:在线分割一切3D物体,超越ESAM!

本文提出AutoSeg3D,将在线3D分割重构为实例跟踪问题,通过长-短期记忆查询流统一维护对象ID与特征。该方法采用三个协同模块:长期记忆(LTM)实现跨帧ID匹配,短期记忆(STM)注入时间上下文,空间一致性学习(SCL)抑制视觉基础模型的过分割问题。实验表明,在ScanNet200上比ESAM提升2.8AP,同时在ScanNet、SceneNN和3RScan数据集上保持优异性能,且具备实时处

文章图片
#3d#人工智能#计算机视觉 +4
极市平台 | NeurlPS‘25开源 | 中科院新作AutoSeg3D:在线分割一切3D物体,超越ESAM!

本文提出AutoSeg3D,将在线3D分割重构为实例跟踪问题,通过长-短期记忆查询流统一维护对象ID与特征。该方法采用三个协同模块:长期记忆(LTM)实现跨帧ID匹配,短期记忆(STM)注入时间上下文,空间一致性学习(SCL)抑制视觉基础模型的过分割问题。实验表明,在ScanNet200上比ESAM提升2.8AP,同时在ScanNet、SceneNN和3RScan数据集上保持优异性能,且具备实时处

文章图片
#3d#人工智能#计算机视觉 +4
OpenCV与AI深度学习 | 使用OpenCV实现球跟踪和落点预测

本文介绍了一种基于OpenCV的球体跟踪和落点预测系统。通过HSV颜色检测定位球体,使用cvzone.findContours()追踪运动轨迹,并采用多项式回归建模球的运动路径。系统能预测球体是否会落入设定的"篮筐"区域(x坐标330-430),并在视频中实时显示预测结果(绿色"Basket"或红色"NoBasket")。该项目整合了Py

文章图片
#人工智能#opencv#深度学习 +3
OpenCV与AI深度学习 | 基于机器视觉的充电器外观缺陷检测方案

通过高清工业相机和平面无影光源构建检测系统,可精准识别40-50mm白色塑胶件表面的划伤、烫伤等低对比度缺陷。该方案采用CS-Vison2.0专业算法模块,实现产品六个面的无死角检测,关键缺陷零漏检,检测效率显著优于人工。系统支持缺陷自动分类记录、数据统计分析及产线优化建议,硬件模块化设计可适配不同产品需求。该方案可直接对接现有产线,避免二次污染,已成功提升多家厂商的质检智能化水平。

文章图片
#人工智能#深度学习#计算机视觉 +4
Coursera吴恩达《深度学习》课程总结(全)

01 神经网络和深度学习(Neural Networks and Deep Learning)1-1 深度学习概论主要介绍:主要对深度学习进行了简要概述。首先,我们使用房价预测的例子来建立最简单的单个神经元组成的神经网络模型。然后,我们将例子复杂化,建立标准的神经网络模型结构。接着,我们从监督式学习入手,介绍了不同的神经网络类型,包括Standard NN,CNN和RNN。不同的神经网络模型适合处

#深度学习#神经网络#人工智能 +1
深度学习与计算机视觉 | 实用CV开源项目汇总(有github代码链接,建议收藏!)

本文介绍了几个常用的计算机视觉项目,内附开源的GitHub代码链接。图像反向搜索动漫场景,使用动漫截图搜索该场景的拍摄地。它告诉你该动画在日本动漫中出现的是哪个动画,哪个情节以及确切的时间。GitHub地址:https://github.com/soruly/trace.moe

文章图片
#深度学习#计算机视觉#人工智能 +3
    共 802 条
  • 1
  • 2
  • 3
  • 81
  • 请选择