pytorch的Backward过程用时太长？

青葱年少 • 2022年5月21日下午3:02 • 问题解决 • 阅读 478

Table of Contents

问题描述

使用pytorch对网络进行训练的时候遇到一个问题，forward阶段很快(只需要几毫秒)，backward阶段却用时很长(需要十多秒)。导致这个问题的原因很容易被大家忽视，而且网上基本上没有直接的解决方案，经过一天的折腾，总算把导致这个问题的原因搞清楚了。

解决方案

导致这个问题的原因在于训练数据的浅拷贝，由于backward过程中的梯度是和模型推理过程中的张量相关的，如果这些张量在被模型使用之前没有被深拷贝，意味着backward过程的会重复从这些张量的原始内存地址中取值，这个过程非常耗时。所以为了避免这个问题，需要养成一个好习惯，就是将张量数据输入模型之前进行深拷贝，pytorch的深拷贝方式如下：

tensor_a = tensor_b.clone().detach()

文章出处登录后可见！

已经登录？立即刷新

pytorch 机器学习深度学习神经网络加速计算机视觉

赞 (0)

青葱年少普通用户

0

视觉笔记（1）cmake+OpenCV+OpenCV_contrib编译及报错总结和解决

上一篇 2022年5月21日

NVIDIA Jetson AGX Xavier安装OpenPCDet完整踩坑记录

下一篇 2022年5月21日

此站出售，如需请站内私信或者邮箱！