딥러닝
Failed to initialize NVML: Driver/library version mismatch - 에러 해결
Present_Kim
2023. 8. 9. 17:31
systemctl isolate graphical
에러
failed to initialize nvml driver/library version mismatch NVML library version: 535.86
해결과정
옛날 해결법을 참고하면 재부팅 혹은 관련 엔비디아 모듈(nvidia-drm)을 종료하라고 한다.
그러나 재부팅을 해도 안 되고 모듈을 종료해도 안 된다.
오히려 모듈을 종료하면 nvidia smi has failed because it couldn't communicate with the nvidia driver 라는 새로운 에러가 발생한다.
자동 업데이트 등의 이유로 535.54에서 535.86 업데이트 되면서 문제가 생긴 것 같은데 정확하진 않다...
해결법
sudo apt --fix-broken install
에러 2
Failed to initialize NVML: Driver/library version mismatch
NVRM: API mismatch: the client has the version 470.223.02, but
NVRM: this kernel module has the version 470.119.02. Please
NVRM: make sure that this kernel module and all NVIDIA driver
NVRM: components have the same version.
해결법
이것 저것 해봐도 안 되다가 아래 해결법을 적용하다가 해결(근데 중간에 막혔는데도 해결 됨..)
1.텍스트 모드 전환
systemctl isolate multi-user
2. 구버전의 nvidia kernel module 제거
rmmod nvidia_drm
rmmod nvidia_modeset
rmmod nvidia_uvm
rmmod nvidia
3. 그래피컬 모드로 전환
rmmod nvidia_drm
rmmod nvidia_modeset
rmmod nvidia_uvm
rmmod nvidia