BourneA 个人主页

@szxcv9876

BourneA

2024-01-05 12:09:48 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

TensorRT模型转换及部署，FP32/FP16/INT8精度区分

TensorRT一、简介TensorRT 是一个深度学习模型线上部署的优化引擎，即 GPU Inference Engine。Tensor 代表张量，即数据流动以张量的方式，如4维张量 [N, C, H, W]。RT表示 runtime。一般情况如上图，线下构建网络结构，训练好模型，然后在实际业务中线上部署到对实时性要求较高（latency敏感）的场景，如一般的嵌入式设备，云端等等。实际应...

#神经网络 #深度学习 #caffe +1

TensorRT模型转换及部署，FP32/FP16/INT8精度区分

#神经网络 #深度学习 #caffe +1

到底了