logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

51c深度学习~合集10

特征可视化分析(下图)清晰地表明,相比于传统对比学习,USDRL所学习到的特征在类别间具有更好的可分性,形成了清晰的簇状结构,证明了特征去相关范式的优越性。USDRL旨在成为该领域的一个基础模型,它不仅在传统的粗粒度预测任务(如动作识别)上表现出色,更在被以往工作所忽视的密集预测任务(如动作检测、分割和预测)上取得了显著成果。MG-FD是USDRL自监督学习的核心。总而言之,这项工作不仅在技术上取

#人工智能
w~视觉~3D~合集1

本文提出一种基于单张输入图片可泛化可驱动的人体神经辐射场方法 SHERF。可以承认的是,本文依然存在一定的缺陷。首先,对于输入图片观测不到一部分人体表面, 渲染出来的结果可以观察到一定的瑕疵,一个解决的办法是建立一种遮挡可知(occlusion-aware)的人体表征。其次,关于如何补齐输入图片观测不到人体部分依旧是一个很难得问题。本文从重建角度提出 SHERF,只能对观测不到的人体部分给出一个确

#人工智能
51c视觉~合集47

门控循环单元 ( GRU ) 网络是一种循环神经网络,旨在高效处理顺序数据。与 LSTM 不同,GRU 的架构更简单,消除了存储单元,只使用两个门(更新和重置)。这使它们更快、更轻量,非常适合我们的情况,因为我们需要实时处理动作而不影响性能。此外,对于跌倒检测等短序列,GRU 的表现通常与 LSTM 一样好,提供了更高效的解决方案而不牺牲准确性。为了使用 GRU 识别动作,我们将每个动作表示为一系

#人工智能
51c视觉~YOLO~合集6~

PENet通过拉普拉斯金字塔将图像分解成不同分辨率的组件。在PENet中,作者通过提出的细节处理模块(DPM)和低频增强滤波器(LEF)来增强每个尺度的组件。其中, Down表示下采样, Gaussian表示高斯滤波器,高斯核的大小为5×5。在每个高斯金字塔操作后,图像的宽度和高度减半,这意味着分辨率是原始图像的1/4。显然,高斯金字塔的下采样操作是不可逆的。为了在上采样后恢复原始的高分辨率图像,

#人工智能
51c视觉~OCR~合集1

Surya 是多语言文档 OCR 工具包,可进行准确的文本行检测,目前支持 90 多种语言,以及即将推出表格和图表检测功能。开源地址:https://github.com/VikParuchuri/surya。

#人工智能
51c※视觉~合集1

我自己的原文哦~https://blog.51cto.com/whaosoft/13436882在计算机视觉领域,评估对象检测模型对于了解其准确性和性能至关重要。此评估的常用指标是交集比 (IoU)、准确率、召回率和平均准确率 (mAP)。这些指标全面衡量了对象检测模型识别和分类图像中对象的能力。在这篇博文中,我们将深入探讨每个概念,解释如何计算它们,并提供 Python 代码来演示如何计算它们。

#人工智能
51c视觉~合集45

我自己的原文哦~https://blog.51cto.com/whaosoft/13320248

#人工智能
51c大模型~合集78

在大语言模型时代小语言模型的增强方法会有不同,包括从头开始训练 SLMs 的训练方法、使 SLMs 遵循指令的监督微调 (SFT)、先进的知识提炼和量化技术,以及 LLMs 中经常使用的技术,以增强 SLMs 针对特定应用的性能。然而,这个环境集包含许多退化的情况,如果简单地采样,它们可能会主导分布。为了选择要训练的关卡,研究者使用了 SOTA UED 算法 SFL,它定期在随机生成的关卡上执行大

#人工智能
51c深度学习~合集13

为了利用VGGT在头部嵌入层面的标记的空间局部性和时间对应性,我们引入了一种时间重排序和头部级自适应异常值过滤技术,该技术帮助HTTM高效合并标记,同时保留其独特性,从而在长输入序列上实现高达7倍的显著加速,且性能无下降。如图2所示,我们面对的不是简单的"红苹果"和"绿苹果",而是像"一只金毛猎犬在公园草坪上追赶红盘"、"盘子里放着鲜红的草莓、黄香蕉和深紫色的葡萄"这样高度复杂的场景。在图5中,我

#人工智能
51c视觉~3D~合集7

如下图所示,在解码每一行(绿色箭头)的开头,它会把正上方一行(红色)的对应信息作为引子,确保局部注意力窗口总能获取到最相关的空间上下文。上图的RD曲线展示了在UVG数据集上的结果,可以看到SWA(红色虚线)在I帧、P帧和整个GOP(图像组)上都稳定优于VCT基线(蓝色虚线)。如上图所示,紫色的方块是当前正在处理的超像素,蓝色的方块是它过去的时空邻居,注意力就在这个蓝色区域内计算。在视频压缩里,我们

#人工智能
    共 486 条
  • 1
  • 2
  • 3
  • 49
  • 请选择