O Linux possui vários consoles virtuais. Ctrl + Alt + F n alterna entre esses consoles. Quando você muda do console 7 para o console 2, os periféricos de entrada e saída são redirecionados do console 7 para o console 2. Quando o console 7 está inativo, ele não tem acesso aos periféricos de entrada / saída: o display não é mostrado na tela, os aplicativos não recebem entrada de teclado, etc.
Por razões históricas, a entrada e saída de som usa canais completamente diferentes dos dispositivos de entrada, como teclado e mouse, e de exibições de vídeo. Os dispositivos do console (a abstração no sistema operacional) cobrem o teclado e o vídeo, mas não o som. A implementação básica mais comum do som em um sistema Unix é independente desse sistema, e a permissão para usar os periféricos de som é concedida com base na participação do grupo e não na propriedade do console. Esta é de fato uma deficiência de projeto.
O Ubuntu configurou as coisas para que a sessão entrasse no console, e apenas elas tivessem acesso ao dispositivo de áudio. Se você alternar os consoles, perderá o acesso ao dispositivo de áudio, a menos que também faça login nesse outro console. Isto é o que realmente deveria ter sido feito desde o início, mas não foi porque os projetistas de interfaces de console não estavam pensando em som.
Quando você alterna para outro console, seus programas continuam em execução, porque a CPU não está associada a um console, mas a uma máquina: qualquer pessoa com uma conta na máquina pode usar o tempo da CPU. O mesmo vale para outros recursos, como memória e arquivos (sujeitos a permissões). São apenas interações com o usuário que são controladas pela propriedade do console. Seu som pára de tocar quando você muda para um console em que não está logado porque seus programas perdem o privilégio de acessar o dispositivo de saída de som.
Acredito que o Ubuntu implemente o controle de acesso via Polkit , mas não sei exatamente como isso funciona.