logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

MiDaS:单目景深估计的创新

MiDaS作为一种基于深度学习的单目深度估计技术,凭借其精确的深度推测能力和广泛的应用场景,已经成为计算机视觉领域的重要研究课题。从自动驾驶到增强现实,从机器人视觉到医学影像,MiDaS都具有巨大的应用潜力。随着技术的不断进步,MiDaS将在未来实现更高的准确性和实时性,为各行业提供更多的价值。

文章图片
#图像处理#python
PiscTrace:让计算机视觉变得简单而高效

在现代计算机视觉应用中,处理图像和视频数据,执行物体检测、深度估计等任务,通常需要强大的硬件支持和复杂的编程技巧。

文章图片
#计算机视觉#目标检测#人工智能 +2
PiscCode多模态人体分析系统:MediaPipe与YOLO的完美融合

本文提出了一种基于MediaPipe和YOLO的多模态人体分析系统,通过集成两大框架的优势实现全面的人体行为理解。系统采用YOLOv11-seg模型进行实时实例分割,结合MediaPipe的BlazePose、手部和面部关键点检测,构建了包含姿态估计、手势识别、面部检测和实例分割的多功能分析平台。创新性地设计了四屏可视化界面,支持原始画面、骨架分割、骨架叠加和纯分割视图的同步展示。系统采用模块化设

文章图片
#计算机视觉#图像处理#目标跟踪 +1
PiscCode基于MediaPipe的实时多模态人体关键点检测与行为识别分析

基于MediaPipe的多模态人体行为识别系统,该系统整合了姿势、手部和面部三个关键点检测模型,能够实时识别眨眼、手势、肢体动作等复杂行为。系统采用并行处理架构,通过优化算法确保计算效率,并支持三屏可视化界面显示。关键技术包括基于眼睛纵横比的眨眼检测、关节角度计算的肢体弯曲识别,以及手部-面部距离测量的触摸动作检测。该系统可广泛应用于人机交互、健康监测、安全监控等领域,具有全面性、实时性和可扩展性

文章图片
#计算机视觉#人工智能#图像处理 +2
PiscCode基于 Mediapipe 的人体多模态关键点检测与可视化系统 —— HumanMultiLandmarker 深度解析

PiscC基于Google Mediapipe Tasks API的HumanMultiLandmarker类,这是一个融合人体姿势、手部和面部关键点检测的多模态系统。该系统通过三个预训练模型(PoseLandmarker、HandLandmarker、FaceLandmarker)实现33个全身关键点、21个手部关键点和478个面部关键点的实时检测,并采用三屏对比方式展示原始画面、骨架点线图和骨

文章图片
#人工智能#python#计算机视觉 +1
基于PiscTrace定制YOLO目标检测结果的图表化呈现

YOLO(You Only Look Once)是当前最广泛应用的实时目标检测模型之一,具备速度快、精度高、部署灵活等特点。无论是视频监控、交通识别,还是工业检测、安防系统,YOLO 都能够在保持帧率的前提下完成高效的物体识别。YOLO 输出的检测结果通常包括:每个目标的类别(如 car、person、bus)置信度分值边界框坐标(在视频分析中)所属帧编号识别结果中,哪些类别最多?目标数量随时间如

文章图片
#目标检测#目标跟踪#人工智能 +2
使用 YOLO 模型进行围栏统计:在 PiscTrace 中轻松完成

在围栏统计任务中,PiscTrace 结合 YOLO 模型提供的物体检测结果,能够精准地识别围栏区域内的目标物体,并根据目标的位置数据进行统计分析。通过设置围栏范围并结合 YOLO 物体检测,PiscTrace 可以实时监控非法入侵者,并记录下所有进入围栏区域的物体,帮助安防人员及时采取措施。在智能农业中,围栏统计可以用于监控围栏区域内的动物活动。通过 YOLO 模型,PiscTrace 可以实时

文章图片
#计算机视觉#目标检测#人工智能 +2
YOLO + MediaPipe在PiscCode 构建“NPC 化”的多脸感知系统

本文提出了一种实时人脸检测与状态分析系统,通过结合YOLO和MediaPipe实现多人脸检测与语义分析。系统采用分层架构:YOLO负责多人脸检测和追踪,MediaPipe处理单张人脸的关键点、表情和朝向信息,最后通过游戏化HUD界面直观展示NPC状态(包括置信度血条、头部朝向和表情)。创新性地解决了MediaPipe固定人脸数量的限制,通过ROI裁剪实现多人脸处理。系统支持稳定追踪(track_i

文章图片
#交互#计算机视觉#图像处理 +1
YOLO 物体检测:PiscTrace 中的实时视觉识别功能

YOLO(You Only Look Once)是一种基于深度学习的物体检测算法,其核心思想是将物体检测转化为回归问题,即直接预测物体的位置和类别,而不是通过滑动窗口或其他逐步方法进行检测。YOLO 的主要优势在于其高效性和实时性:它通过一次前向传播就能识别图像中的所有物体,并且在多个物体存在的情况下也能准确地输出每个物体的位置和类别。物体检测的基本任务是识别图像中的所有物体,并为每个物体生成一个

文章图片
#计算机视觉#目标检测#人工智能 +3
基于PiscTrace定制YOLO目标检测结果的图表化呈现

YOLO(You Only Look Once)是当前最广泛应用的实时目标检测模型之一,具备速度快、精度高、部署灵活等特点。无论是视频监控、交通识别,还是工业检测、安防系统,YOLO 都能够在保持帧率的前提下完成高效的物体识别。YOLO 输出的检测结果通常包括:每个目标的类别(如 car、person、bus)置信度分值边界框坐标(在视频分析中)所属帧编号识别结果中,哪些类别最多?目标数量随时间如

文章图片
#目标检测#目标跟踪#人工智能 +2
    共 56 条
  • 1
  • 2
  • 3
  • 6
  • 请选择