深度学习模型推理速度缓慢原因分析

碰到一个问题，在训练好一个模型后，实际使用时，即只有前向推理过程，速度缓慢，大概1s能执行100次。之所以会认为推理的速度变慢，主要原因在于，在训练模型时，会在训练集和验证集上，获取算法的准确率，那么就需要进行前向推理。在这里，会有大概500,000个样本，而只需要200s左右，大约2500/s。那么为什么在实际进行推理时速度会变慢这么多呢？分析后发现，主要原因有二：1、训练模型时，...

keep_forward

20105人浏览 · 2017-12-23 10:34:55

keep_forward · 2017-12-23 10:34:55 发布

碰到一个问题，在训练好一个模型后，实际使用时，即只有前向推理过程，速度缓慢，大概1s能执行100次。之所以会认为推理的速度变慢，主要原因在于，在训练模型时，会在训练集和验证集上，获取算法的准确率，那么就需要进行前向推理。在这里，会有大概500,000个样本，而只需要200s左右，大约2500/s。

那么为什么在实际进行推理时速度会变慢这么多呢？

分析后发现，主要原因有二：

1、训练模型时，读取的数据是tfrecord格式的数据，有其它线程负责把数据导入内存，大大降低了从硬盘读取内存的开销；
2、在训练模型，是按照batch读取数据，然后输入到网络中进行批量处理，一个batch大小为128，而在实际使用时，一般是单个样本输入，这就导致了推理速度变慢。

对于原因1，可以采用相似的方式，另起线程读数据，然后再处理。

对于原因2，如果实时性要求不是特别高，能够缓冲一部分再做处理，那么可以按照batch批处理的方式完成。可以大大加快运行速度。

百度飞桨AI Studio社区

学大模型，用大模型上飞桨星河社区！每天8点V100G算力免费领！免费领取ERNIE 4.0 100w Token >>>

更多推荐

cover

利用Amazon Bedrock畅玩Claude 3等多种领先模型，抢占AI高地(体验倒计时4小时)

百度飞桨星河社区

cover

RAPTOR：索引树状 RAG，使用树结构来捕捉文本的高级和低级细节

百度飞桨星河社区

cover

MultiHop-RAG：多跳查询的基准检索增强生成

百度飞桨星河社区

所有评论(0)

查看更多评论

keep_forward

已为社区贡献1条内容