반응형
export/import를 통해서 컨테이너를 백업하고 복원할 때
잘 돌아가던 nvidia docker 컨테이너가 갑자기 gpu가 동작하지 않을 때가 있다.
1. gpu 동작 확인
Nvidia gpu를 사용하는 컨테이너인 경우 생성 후 다음 2가지의 동작을 확인 해봐야 한다.
- nvidia-smi 커맨드 정상 동작 확인
- python을 실행하여 torch.cuda.is_available() 함수를 통해 실제로 cuda가 동작하는지 확인
만일 정상 적으로 동작 하지 않는 경우
컨테이너를 생성할 때 다음 옵션을 함께 추가하면 해결 되는 경우가 많다.
--runtime=nvidia -e NVIDIA_VISIBLE_DEVICES=all -e NVIDIA_DRIVER_CAPABILITIES=all
2. 컨테이너 생성 예
docker run --runtime=nvidia -e NVIDIA_VISIBLE_DEVICES=all -e NVIDIA_DRIVER_CAPABILITIES=all --net=host -i -t -v /etc/localtime:/etc/localtime:ro --name=name_container name_image /bin/bash
반응형
반응형
'IT > 리눅스' 카테고리의 다른 글
리눅스 기본, 필수 명령어 50개 (사용 빈도 순, ls, cd, pwd, cp ...) (0) | 2023.04.26 |
---|---|
도커 컨테이너 이미지 백업 및 복구 하기 (docker container, save, load, export, import) (0) | 2023.04.26 |
ChatGPT 대항마 Goolge Bard 베타버전 성능, 코딩 테스트 (0) | 2023.04.20 |
chatGPT 모델 종류 및 API 사용 비용(fine tuning model, ChatGPT3.5, ChatGPT4, ada, babbage, curi, danvinci) (0) | 2023.04.20 |
python 가상환경, venv, conda 사용법 비교 (0) | 2023.04.19 |