Eu acho que você terá problemas porque o sistema operacional irá transmitir apenas para um dispositivo de som por vez - pelo menos pensando no Windows ou OS X. O problema é que você só pode selecionar um, certo?
A única solução que eu poderia pensar seria uma interface de som com um mixer rotativo, coisas que são usadas em estúdios de gravação profissional. Eu tenho uma placa de som Saffire que pode produzir mixagens diferentes para fones de ouvido diferentes, mas você precisa de um software que suporte isso também, é claro.