
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
本文介绍了作者在音频分类任务中的实践,重点关注环境声音分类的工程化实现。作者使用EfficientAT模型,通过知识蒸馏方法将Transformer模型的能力迁移到轻量级CNN上,并结合动态卷积技术提升性能。针对公司内部数据样本不均衡问题,采用自定义CBLoss损失函数进行优化。为实现TensorFlow架构下的部署,作者将PyTorch前处理代码复写成TensorFlow版本,并将训练好的模型转

yolov7,yoloX相关论文还没细看,yolov8就出来了。太卷了!YOLOv5和YOLOv8的区别。

以代码+注释的形式,详解siamfc的推理过程。后续会详解siamfc的训练过程。

以代码+注释的形式,详解siamrpm的训练过程。

以代码+注释的形式,详解siamfc的训练过程。

以代码+注释的形式,详解siamrpm的推理过程。后续会详解siamrpn的训练过程。

论文部分片段阅读与官方代码讲解

一种非常经典的多模态融合感知方案叫 BEVFusion。这是一种用于多任务多传感器 3D 感知的高效通用框架。BEVFusion 将相机和 LiDAR 功能统一在共享 BEV 空间中,完全保留几何和语义信息。相机和点云分支没有明显的主次关系,相互独立,结果上又相辅相成。高效、准确的多传感器感知对于自动驾驶汽车的安全至关重要。BEVFusion 将最先进的多传感器融合模型的计算成本降低了一半,并在小

OSTrack论文(尤其是其中的候选消除模块)讲解

论文题目:Depth Anything: Unleashing the Power of Large-Scale—— 任何深度:释放大规模无标记数据的力量(注意论文名字,因为后续的很多工作都是在未标注数据上做的。作者认为Depth Anything是一种用于稳健单目深度估计的非常实用的解决方案。在不追求新颖的技术模块的情况下,作者目标建立一个简单而强大的基础模型(而且是Zero-shot)。为此,








