Python深度学习训练意外终止:退出代码 -1073741571 是什么原因?

ID:20934 / 打印

python深度学习训练意外终止:退出代码 -1073741571 是什么原因?

python进程意外终止:退出代码-1073741571

问题描述

在使用pycharm和anaconda prompt命令行进行深度学习训练时,训练突然中断,没有任何错误提示,也没有达到预期的迭代次数。事件查看器显示退出代码为 -1073741571 (0xc00000fd)。

原因分析

立即学习“Python免费学习笔记(深入)”;

经过代码排查发现,问题出现在一个训练循环中。源代码将用于收集训练损失的列表loss_list初始化为torch.zeros,但是实际应该初始化为:

loss_list = np.zeros(len(dataloader.dataset))

解决方案

将loss_list初始化为torch.zeros修改为loss_list = np.zeros即可解决问题。

进一步优化

如果收集的损失不需要梯度,还可以进行进一步的优化:

for j in range(batch_size):   loss_list[index[j]] = loss[j].item()

这样可以避免对每个损失进行backward,提高训练效率。

上一篇: 如何在 Web 系统中获取 Python 脚本的输出流?
下一篇: Pip Install 中 "-e" 或 "--editable" 选项的妙用:如何使用可编辑模式安装和开发软件包?

作者:admin @ 24资源网   2025-01-14

本站所有软件、源码、文章均有网友提供,如有侵权联系308410122@qq.com

与本文相关文章

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。