logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【学习笔记(更新中)】【人工智能】北京大学 TensorFlow 笔记及实践

学习资料:【北京大学】Tensorflow学习笔记,从零基础入门到项目实战分享学习教程https://www.bilibili.com/video/BV1GE411k7Q2?p=1笔记:1、P122、

#tensorflow
【论文速读】(2025 TMM)SkeletonX: Data-Efficient Skeleton-based ActionRecognition via Cross-sample Feature

Zongye Zhang, Wenrui Cai, Qingjie Liu, Yunhong Wang论文地址:https://arxiv.org/pdf/2504.11749现有的骨架动作识别模型在大规模数据集上表现优异,但在新场景(如新动作类别、不同表演者,或不同骨架布局)中适应性较差。One-shot 学习:每个新动作类别仅有一个参考样本。Limited-scale训 练:从零开始训练,仅使

文章图片
#深度学习
解读 2s-AGCN 代码

论文:https://openaccess.thecvf.com/content_CVPR_2019/papers/Shi_Two-Stream_Adaptive_Graph_Convolutional_Networks_for_Skeleton-Based_Action_Recognition_CVPR_2019_paper.pdf论文代码:https://github.com/lshiwjx/

文章图片
【论文阅读 + 核心代码定位解读】(2023 AAAI)HiCLR

单方向将 “应用了 strong augmentations 的骨架点特征” 往 “应用了 weak augmentations 的骨架点特征” 方向拉近。本文的 HiCLR 是基于经典对比学习框架 MoCo v2,对应最下面的两个分支。sim() 可以是任何衡量相似性的函数,本文用的是 KL Divergence。其中,InfoNCE Loss 只应用在第三和四分支生成的 pairs 上。图中第

文章图片
#深度学习
【代码 bug 记录】PyTorch 的 Dataloader 如何加载 List 对象?

0、写在前面在记录该问题解决方案的时候,也有在 csdn 上搜到某位小伙伴遇到同样的问题,但没有说明原因。那我就记录一下吧。1、问题之前看到一份代码,在 __init__() 函数中,加载的每一条数据都是一个列表 List【长度为 len_list】,列表中的每一项是一段经过处理的视频,维度为 [C, T, H, W]。所以 dataset 中每一条数据的维度应该是 [len_list, C, T

#pytorch#list
【跟着代码读论文】ViT(2021 ICLR)An image is worth 16x16 words: Transformers for image recognition at scale

论文: An image is worth 16x16 words: Transformers for image recognition at scale.Github code(PyTorch Implementation):https://github.com/lucidrains/vit-pytorch目录Model OverviewGithub Code UsageProcedure 1

文章图片
#计算机视觉#深度学习
《学习篇:Matlab 不规则物体中心线的提取 方法一》

cv小白上路,请多指教 没思路,参考了一下这个答案 https://ww2.mathworks.cn/matlabcentral/answers/43506-polygon-width-and-centerline并结合了这个https://blog.csdn.net/yangyangyang20092010/article/details/51541940  虽然...

#图像处理
【论文阅读笔记 + 思考 + 总结】MoMask: Generative Masked Modeling of 3D Human Motions

创新点:VQ-VAE 👉 Residual VQ-VAE,对每个 motion sequence 输出一组 base motion tokens 和 v 组 residual motion tokensbidirectional 的 Masked transformer 用来生成 base motion tokensResidual Transformer 对 residual motion t

文章图片
#人工智能#深度学习#AIGC
【论文阅读笔记】(2022 ECCV)CMD: Self-supervised 3D Action Representation Learning with Cross-modal Mutual Di

作者提出了一个跨模态互蒸馏(Cross-modal Mutual Distillation,CMD)的自监督学习框架。其中,模态之间进行的是双向知识蒸馏(bidirectional knowledge distillation);蒸馏的知识(knowledge)是样本和其他样本的相似度分布(the neighboring similarity distribution)在蒸馏的过程中,为老师(te

文章图片
#论文阅读#计算机视觉
PyTorch 1.7 Video 初体验(Video Datasets,Video IO,Video Classification Models,Video Transform)

环境Win 10Anaconda NavigatorPyCharmcuda 10.1torch 1.7.1torchvision 0.8.2Python 3.8视频数据集 & 加载UCF101:https://pytorch.org/docs/stable/torchvision/datasets.html#ucf101HMDB51:https://pytorch.org/docs/sta

#pytorch
    共 20 条
  • 1
  • 2
  • 请选择