Por que meu sistema está congelando quando tento desvincular a GPU do radeon?

2

Neste momento, estou tentando realizar isso: link

Eu consegui tudo no host para trabalhar. O DRI_PRIME está funcionando corretamente, conforme mostrado abaixo:

 $ DRI_PRIME=1 glxinfo | grep "renderer string"
 OpenGL renderer string: Gallium 0.4 on AMD HAWAII (DRM 2.43.0, LLVM 3.7.1)

 $ glxinfo | grep "renderer string"
 OpenGL renderer string: Mesa DRI Intel(R) Sandybridge Server

O problema é que o sistema congela completamente quando estou tentando mover a GPU de radeon para vfio-pci usando este script:

#!/bin/bash
set -x
echo "1002 67b1" > /sys/bus/pci/drivers/vfio-pci/new_id
echo "0000:01:00.0" > /sys/bus/pci/devices/0000:01:00.0/driver/unbind
echo "0000:01:00.0" > /sys/bus/pci/drivers/vfio-pci/bind
echo "1002 67b1" > /sys/bus/pci/drivers/vfio-pci/remove_id

echo "1002 aac8" > /sys/bus/pci/drivers/vfio-pci/new_id
echo "0000:01:00.1" > /sys/bus/pci/devices/0000:01:00.1/driver/unbind
echo "0000:01:00.1" > /sys/bus/pci/drivers/vfio-pci/bind
echo "1002 aac8" > /sys/bus/pci/drivers/vfio-pci/remove_id

set +x

Congela na linha: echo "0000: 01: 00.0" > /sys/bus/pci/devices/0000:01:00.0/driver/unbind e a única coisa que posso fazer é desligar o sistema através do botão de energia.

Eu verifiquei o journalctl e percebi que isso continuava acontecendo depois que o sistema congelou:

Apr 02 11:13:12 joey-arch-pc kernel: WARNING: CPU: 1 PID: 7293 at drivers/gpu/drm/radeon/radeon_gart.c:246 radeon_gart_unbind+0xca/0xe0 [radeon]()
Apr 02 11:13:12 joey-arch-pc kernel: trying to unbind memory from uninitialized GART !

Aqui está o resto das mensagens do journalctl com traços de chamadas: link

Eu encontrei uma boa quantidade de relatórios de bugs semelhantes via google, mas eles eram bastante antigos. Havia uma grande variedade de diferentes correções que encontrei relacionadas a problemas semelhantes, mas como sou inexperiente com esse tipo de coisa, não sabia exatamente qual seria o melhor patch a ser usado. Eu tentei o 'hotplug: Propagar a configuração' ignore hotplug 'para pai para bug # 61891' patch, mas não funcionou. Eu poderia experimentar vários patches diferentes, mas achei que seria mais lógico postar aqui e ver se alguém tem uma solução antes de perder tempo tentando cegamente um monte de patches.

Edit: Acabei de perceber antes das mensagens sobre o GART eu recebo esta mensagem:

Apr 02 11:13:12 joey-arch-pc kernel: radeon 0000:01:00.0: Userspace still has active objects !

Além disso, uma atualização: eu pretendo experimentar o kernel mais recente, bem como os drivers AMDGPU (para CI, de modo experimental) e ver como isso funciona. Fora isso, nenhum progresso foi feito.

    
por MonopolyMan 03.04.2016 / 15:30

0 respostas