Failed to get convolution algorithm. This is probably because cuDNN failed to initialize
https://stackoverflow.com/questions/53698035/failed-to-get-convolution-algorithm-this-is-probably-because-cudnn-failed-to-in
1、首先检查安装的 tensorflow / pytorch 版本 和 环境中的 cuda cudnn版本,是否满足官方要求;
2、查看机器监控,显存是否够用。
watch -n 0.2 nvidia-smi
如果是显存爆了,导致程序无法运行:
1)首先看下是否有之前运行的程序没有被完全关掉,导致还占用着显存,如果有,清除自己之前运行的进程, terminal 里输入ps aux
查看正在运行进程和进程pid,kill -9 进行pid
清除对应进程。
2)再次运行,如果显存还是不够
- 换显存更大的显卡
- 调小batch_size
- 改用更小的网络
- 减小数据量
- 在代码中做显存控制,浏览器搜索相关方法即可