训练过程中如果 ctrl+c 停掉任务进程,会出现部分 GPU 显存不释放的情况,需要自己 kill 进程,如下所示:
GPU 显存不释放
感谢您关注 MegEngine 项目,请问这个情况是出现在多卡训练中吗?
对,是使用多卡进行训练,分类和检测都会出现
不都是这个样子吗 ,没有训练完 现存还会继续占用的 我用的torch,paddle,tensorflow都是这样
您好,可以提供一下您的训练脚本吗,我们复现之后排查一下,谢谢~
感谢您关注 MegEngine 项目,请问这个情况是出现在多卡训练中吗?
对,是使用多卡进行训练,分类和检测都会出现
不都是这个样子吗 ,没有训练完 现存还会继续占用的 我用的torch,paddle,tensorflow都是这样
您好,可以提供一下您的训练脚本吗,我们复现之后排查一下,谢谢~