Статья-заметка по настройке рабочей ноды (worker) Kubernetes 1.27.1 для работы с GPU AMD Radeon. Bare-metall, Alma Linux 9 (RHEL 9), AMD Radeon RX 6800 (gfx1030).
Поддерживаются видеокарты с RX 5xxx и выше, спасибо за поддержку AMD! Никаких RX 4xx, 5xx.
Установка компонентов AMD на рабочей ноде (worker)
1 |
dnf -y install https://repo.radeon.com/amdgpu-install/5.3/rhel/9.0/amdgpu-install-5.3.50300-1.el9.noarch.rpm |
Нагрузку на видеокарту можно посмотреть с помощью /opt/rocm/bin/rocm-smi
Запуск плагина с control-plane
Развертывание daemonset, который будет поддерживать работу poda для проброса видеокарты AMD на каждой ноде
1 2 |
curl -O https://raw.githubusercontent.com/RadeonOpenCompute/k8s-device-plugin/master/k8s-ds-amdgpu-dp.yaml kubectl create -f k8s-ds-amdgpu-dp.yaml |
Проверка работоспособности (опционально)
1 2 3 4 5 6 7 8 9 10 11 12 13 14 |
cat <<EOF | kubectl apply -f - apiVersion: v1 kind: Pod metadata: name: rocm-clpeak namespace: default spec: containers: - name: rocm-clpeak image: androsovm/rocm-clpeak:latest resources: limits: amd.com/gpu: 1 # requesting a GPU EOF |
Не забудьте удалить pod после теста