logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

使用yolov8训练实例分割任务

以下是 YOLOv8 训练实例分割任务的,包含「数据集准备→配置文件编写→训练代码→验证→推理→结果可视化」全流程,兼顾命令行和 Python 脚本两种方式,适配自定义数据集场景。

文章图片
#人工智能
MLLM逆袭传统检测器!Rex-Omni:用Next Point Prediction实现高精度通用目标检测

传统目标检测器(如DINO、Grounding DINO)在定位精度上表现出色,但缺乏复杂语言理解能力;而多模态大语言模型(MLLM)虽然具备强语言理解能力,却在精细视觉定位上存在低召回率、坐标漂移和重复预测等问题。针对这一矛盾,本文提出了Rex-Omni——一个3B参数的MLLM模型,通过三大核心设计实现了高精度定位与强语言理解的统一:1)采用量化相对坐标表示,将坐标映射为1000个特殊toke

文章图片
#目标检测#人工智能#计算机视觉
一文看懂!视觉语言模型VLM

视觉语言模型(Visual-Language Models, VLMs)是一种融合视觉信息与语言信息的多模态人工智能模型。它旨在通过同时处理图像、视频等视觉数据以及文本、语音等语言数据,实现对复杂场景的深度理解和生成。这种模型的核心在于打破视觉与语言之间的模态壁垒,使机器能够像人类一样综合运用视觉和语言能力来完成各种任务。在人工智能的发展历程中,视觉和语言一直是两个相对独立的研究领域。计算机视觉专

文章图片
#语言模型#人工智能#自然语言处理
国产芯片助力大模型推理!LMDeploy+昇腾 它来了!

近日,LMDeploy 基于其强大的 PytorchEngine,增加了对华为昇腾设备的支持。这样一来,在华为昇腾上使用 LDMeploy 的方法与在英伟达 GPU 上使用 PytorchEngine 后端的方法几乎相同。因此,我们将在本期内容中为大家带来在华为昇腾设备上使用 LMDeploy 的方法。

文章图片
#人工智能#深度学习#算法
Ascend ATC相关参数说明和描述

关联参数: --layer_fusion_enable:深度融合的层不支持 dump,即*.om 转 json 文件里,属性 is_dump_available 为 0 的层不支持 dump。● 当配置--net_optimize_enable=1 时,使能所有融合规则,如果配置了-- fusion_switch_file,以配置的融合规则文件为准。● 当配置--net_optimize_enab

文章图片
#linux#运维#服务器
MLLM逆袭传统检测器!Rex-Omni:用Next Point Prediction实现高精度通用目标检测

传统目标检测器(如DINO、Grounding DINO)在定位精度上表现出色,但缺乏复杂语言理解能力;而多模态大语言模型(MLLM)虽然具备强语言理解能力,却在精细视觉定位上存在低召回率、坐标漂移和重复预测等问题。针对这一矛盾,本文提出了Rex-Omni——一个3B参数的MLLM模型,通过三大核心设计实现了高精度定位与强语言理解的统一:1)采用量化相对坐标表示,将坐标映射为1000个特殊toke

文章图片
#目标检测#人工智能#计算机视觉
华捷艾米3D结构光模组测试

自带的UVC摄像头帧率为30帧,分辨率最大为1920x1080,另外提供1280x720、640x480、320x240三种分辨率,图像保持1920x1080的原比例缩放,并根据新分辨率进行裁剪,例如640x480为1920x1080的图像原比例缩放到853x480,再对称裁剪到640x480。不过相应的,活体被判断为伪样本的效果相对稍差,除了正脸的情况效果很稳定,大概在15度以上侧脸时,效果就开

文章图片
#3d#人工智能
算法常见问题

是一种二分类模型,它的基本模型是定义在特征空间上的间隔最大的线性分类器,间隔最大使它有别于感知机。线性可分SVM当训练数据线性可分时,通过最大化硬间隔(hard margin)可以学习得到一个线性分类器,即硬间隔SVM。线性SVM当训练数据不能线性可分但是近似线性可分时,通过最大化软间隔(soft margin)也可以学习到一个线性分类器,即软间隔SVM。非线性SVM当训练数据线性不可分时,通过使

文章图片
#算法
SAM3 使用文本提示进行图像分割详细步骤

SAM3 通过文本提示进行图像分割的流程清晰且高效,主要包括模型初始化、图像预处理、文本提示设置、模型推理和结果可视化等步骤。这种基于文本提示的分割方式大大提升了交互性和实用性,使得用户可以通过简单的文本描述来精确分割感兴趣的图像区域。

文章图片
#深度学习#人工智能#计算机视觉
pytorch 多机多卡训练方法

在深度学习训练中,使用多机多卡(多台机器和多块 GPU)可以显著加速模型训练过程。

文章图片
#pytorch#人工智能#python
    共 52 条
  • 1
  • 2
  • 3
  • 6
  • 请选择