Primeiro, você precisa de um produto que possa emitir som para dois dispositivos simultaneamente. Não muitos produtos de som podem fazer isso, como a maioria apenas emite o som para o dispositivo de som padrão. Ou você pode rodar dois jogadores do mesmo arquivo, cada um emitindo seu som para um cartão diferente (difícil de sincronizar corretamente).
Um produto que faz edição e mixagem de vídeo pode ser capaz de fazer isso. Ouvi dizer que o MixPad (shareware $ 59.95) é um desses produtos.
Também deve ser possível com o GStreamer de código aberto framework (requer algum estudo), criando um pipe similar a este:
# The number and order of the tracks must be known
gst-launch-1.0 \
filesrc location=example.mkv ! decodebin name=decoded \
decoded.src_0 ! queue ! autovideosink \
decoded.src_1 ! queue ! audioconvert ! alsasink device="hw:1,0" \
decoded.src_2 ! queue ! audioconvert ! alsasink device="hw:2,0"