
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
利用torchvision.models实现卷积神经网络的backbone
改写torchvision.models实现其他任务网络的backbone,包括网络结构定义和与加载预训练权重等步骤
深度学习中常用backbone总结
深度学习常见的backbone结构、特点汇总

大疆M3M/P4M 航拍图像辐射定标流程及python实现
对DJI M3M/P4M设备的航拍数据进行辐射定标

使用wandb/tensorboard管理、可视化卷积神经网络训练日志
wandb、tensorboard、torchSummary等工具使用笔记
vllm/spec_decode/spec_decode_worker.py 投机采样的一次前向推理 流程分析
vllm投机采样的前向推理流程分析

vllm attention算子
在vllm/worker/model_runner.py中,class GPUModelRunnerBase的初始化过程决定使用attention的类型。

[待完善] torchvision.dataset 内置分类数据集的简单介绍
对torchvision.dataset的内置数据集进行简单介绍

卷积神经网络特征图可视化及其意义
卷积神经网络特征图可视化方法及其意义
损失函数出现nan的原因分析及对策
神经网络训练时出现NAN的原因及解决办法
到底了