
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
本研究应用深度学习网络定量分析家族性渗出性玻璃体视网膜病变(FEVR)与早产儿视网膜病变(ROP)的血管特征。应用人工智能自动血管提取技术,量化比较了ROP、FEVR与健康足月婴儿的眼底血管形态特征。基于深度学习的血管形态定量分析可为FEVR与ROP的鉴别诊断提供客观依据。

红外/可见光目标检测数据集包含可见光(RGB)图像和红外(IR)图像两个模态。本文讨论前端融合,将可见光图像和红外图像进行通道的合并(Marge),得到 6通道的图像(特征向量),送入 YOLOv8 模型进行训练。

本文详细介绍使用自己的数据集训练专用的 YOLOv5 模型,包括数据集的准备,模型配置,训练和推理过程。

大语言模型的浪潮推动了 AI Agent 相关研究快速发展,AI Agent 是当前通往 AGI 的主要探索路线。大模型让 AI 会思考,而 Agent 让思考能落地"——这正是Deepseek等平台正在构建的下一代智能基础设施。

直方图统计量图像增强,是基于直方图的统计量信息(如均值和方差)对图像的灰度和对比度进行调整。直方图统计量不仅用于图像的全局增强,在图像局部增强中更加有效。局部均值和方差是根据像素邻域特征进行灰度调整的基础。像素邻域的局部均值是平均灰度的测度,局部方差是对比度的测度。使用局部均值和方差可以开发出简单而强大的图像局部增强算法。......

所谓图像分割是指根据灰度、彩色、空间纹理、几何形状等特征把图像划分成若干个互不相交的区域,使得这些特征在同一区域内表现出一致性或相似性,而在不同区域间表现出明显的不同。简单的说就是在一副图像中,把目标从背景中分离出来。从数学角度来看,图像分割是将数字图像划分成互不相交的区域的过程。图像分割的过程也是一个标记过程,即把属于同一区域的像索赋予相同的编号。

基于图像分割的图像融合通过图像分割,获得前景目标的掩模图像 mask,将前景图像叠加到背景图像的指定位置,直接进行图像拼接。

MOCHA(Multi-modal Objects-aware Cross-arcHitecture Alignment)是一种面向少样本个性化目标检测的多模态跨架构知识蒸馏方法,核心是将大型视觉语言模型(VLM)的区域级多模态语义迁移到轻量级纯视觉目标检测器中。本文将大型 Transformer-based 视觉语言教师模型(如 LLaVa-1.5-7B)的语义知识,高效迁移到轻量级 CNN-b

MOCHA(Multi-modal Objects-aware Cross-arcHitecture Alignment)是一种面向少样本个性化目标检测的多模态跨架构知识蒸馏方法,核心是将大型视觉语言模型(VLM)的区域级多模态语义迁移到轻量级纯视觉目标检测器中。本文将大型 Transformer-based 视觉语言教师模型(如 LLaVa-1.5-7B)的语义知识,高效迁移到轻量级 CNN-b

本文介绍了字节跳动推出的AI编程助手Trae插件的功能与安装方法。Trae插件支持代码自动补全、生成、解释、优化等多项功能,适配VS Code和JetBrains全系列IDE。文章详细说明了在VS Code和PyCharm中的安装步骤,包括插件搜索、安装、登录授权等流程。同时介绍了Trae插件的界面布局和代码补全功能,包括根据上下文和注释自动补全代码的使用方法。该插件支持多种主流编程语言,能有效提
