logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Linux (Ubuntu) C++ OpenCV 5.0 完整源码编译安装教程

Ubuntu 官方源无 OpenCV5 预编译 C++ 库,C++ 使用必须源码编译,下面适配 Ubuntu20.04/22.04/24.04 全版本,含基础版、CUDA 加速版、环境配置、项目测试全套流程。编译耗时:4 核 CPU 约 30~60 分钟,多核越快。:独立安装路径,不和系统 OpenCV4 冲突。:生成 pkg-config 配置,方便编译链接。二、CMake 配置编译参数(两种方

#linux#ubuntu#c++
NVIDA开源视觉定位神器:LocateAnything

LocateAnything全称为LocateAnything: Fast and High-Quality Vision-Language Grounding(并行框解码视觉语言定位模型)。开源了 LocateAnything-3B(30 亿参数)。模型定位:通用开放词汇视觉定位基座,一句话文本指令→图像自动输出目标包围框,统一开放域检测、指代定位、UI 控件拾取、OCR 文字框选四大任务,主打

#人工智能
强化学习和深度学习的区别与联系

强化学习(RL)和深度学习(DL)是人工智能中两个重要但不同的分支,它们既有明显区别,又能紧密融合。强化学习与深度学习的工作原理如下图所示。3)通过RL和DL结合开放场景:让AI既“识别路况”(DL)又“决定如何避开障碍”(RL),完成自动驾驶。5)通过二者融合可共同解决高维复杂任务:DL为RL提供表征能力,RL为DL提供决策能力。3)强化学习是“决策框架”:关注如何行动以达成目标,核心是序列决策

#深度学习#人工智能
目标检测用YOLO还是用VLM模型?

1、YOLO和VLM各自特点常规 / 实时 / 工业目标检测优先用 YOLO;开放词汇、小目标、复杂场景、需语义理解时用 VL 模型(VLM)。两者在不同的场景下不能说谁有绝对的优势。:快、小、准(封闭集),适合实时与嵌入式。:强语义、开放词汇、小目标更好,但慢、贵、耗显存。在同样的硬件条件下YOLO的推理速度(以YOLOV8为例)和VLM (以Qwen2.5 7B为例)相比速度约为10倍左右。2

#目标检测#人工智能
人工智能模型DeepSeek-V3和DeepSeek-R1的区别

以低成本和高通用性见长,适合广泛的应用场景;通过强化学习实现了专业领域的推理突破,适合需要深度推理和复杂逻辑分析的任务。两者的互补性体现了DeepSeek在技术路径上的多样性,既满足通用需求,又推动前沿推理能力的发展。

文章图片
#人工智能
手眼协调的运动物体抓取------具身智能机器人的感知-决策- 执行-监督的技术闭环

基于神经符号的具身智能机器人通过感知、决策、执行和监督四个关键环节构建起技术闭环,从而实现高效、智能的任务执行。监督模块的主要任务是实时监测感知、决策和执行三个环节的运行状态,评估系统的整体性能,并根据需要进行调整和优化。基于神经符号的决策系统结合了神经网络的深度学习能力和符号系统的逻辑推理能力,能够处理复杂的任务逻辑和动态环境变化。是三者协同的最终“成果”。这四个技术环节紧密耦合,共同构成了一个

#机器人#人工智能
目标检测用YOLO还是用VLM模型?

1、YOLO和VLM各自特点常规 / 实时 / 工业目标检测优先用 YOLO;开放词汇、小目标、复杂场景、需语义理解时用 VL 模型(VLM)。两者在不同的场景下不能说谁有绝对的优势。:快、小、准(封闭集),适合实时与嵌入式。:强语义、开放词汇、小目标更好,但慢、贵、耗显存。在同样的硬件条件下YOLO的推理速度(以YOLOV8为例)和VLM (以Qwen2.5 7B为例)相比速度约为10倍左右。2

#目标检测#人工智能
NVIDA开源视觉定位神器:LocateAnything

LocateAnything全称为LocateAnything: Fast and High-Quality Vision-Language Grounding(并行框解码视觉语言定位模型)。开源了 LocateAnything-3B(30 亿参数)。模型定位:通用开放词汇视觉定位基座,一句话文本指令→图像自动输出目标包围框,统一开放域检测、指代定位、UI 控件拾取、OCR 文字框选四大任务,主打

#人工智能
新版OpenCV5.0在ONNX模型的推理应用

OpenCV5 是架构级大改版,彻底清理老旧 C 接口、重写 DNN 推理引擎、原生支持视觉大模型、硬件加速体系重构,最低编译标准升级至 C++17。从 4.x 的22% 暴涨至 80%+,YOLO、SAM、LLaVA、ResNet、Diffusion 等主流模型直接导入无压力。全面使用 std 智能指针、 constexpr、结构化绑定等现代语法,内存管理更安全,消除大量兼容宏代码。内置 Tok

#算法
Halcon25 例程 compare_surface_sheet_of_light.hdev 解析---2

该例程的主要功能是线激光轮廓仪设备采集金属零件的 3D 轮廓数据,构建参考 3D 模型,再对多个待测零件做。也是3D 表面对比的关键,原始点云稀疏、无拓扑,直接对比误差大,需要预处理。:未标定模式,仅用缩放系数将像素视差转为 3D 坐标,替代高精度标定,成本低、速度快,适合定性对比。3)缩放系数是经验值,让 3D 点间距近似真实零件尺寸,不代表绝对精度,完全满足表面对比需求。:,将线激光采集的单条

#数据库
    共 45 条
  • 1
  • 2
  • 3
  • 4
  • 5
  • 请选择