深度学习训练突然退出,提示“进程已结束,退出代码为 -1073741571”,该如何解决?

ID:20821 / 打印

深度学习训练突然退出,提示“进程已结束,退出代码为 -1073741571”,该如何解决?

进程异常退出,错误代码 -1073741571

在使用 pycharm 和 anaconda prompt 时,深度学习训练可能会突然结束,没有任何报错信息,也不会进行到预期的迭代上限。提示的信息为:"进程已结束,退出代码为 -1073741571 (0xc00000fd)”。

分析事件查看器中应用程序日志显示:

  • 错误应用程序:python.exe
  • 错误模块:ntdll.dll
  • 异常代码:0xc00000fd

经过反复排查,发现问题代码段如下:

loss_list = torch.zeros(len(dataloader.dataset))

将 loss_list 初始化为 torch.zeros 会导致异常退出。修改为以下代码即可解决问题:

loss_list = np.zeros(len(dataloader.dataset))

如果收集的损失不需要梯度,则还可以进一步优化代码:

for j in range(batch_size):   loss_list[index[j]] = loss[j].item()
上一篇: Python 自写函数返回值消失的原因是什么?
下一篇: 如何使用正则表达式替换字符串开头和结尾,并保留中间部分?

作者:admin @ 24资源网   2025-01-14

本站所有软件、源码、文章均有网友提供,如有侵权联系308410122@qq.com

与本文相关文章

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。