Você pode fazer isso com o ffmpeg. Sua página Manipulação de Canais de Áudio tem muitos exemplos, incluindo este exemplo para dividir canais de áudio em arquivos separados:
ffmpeg -i stereo.wav -map_channel 0.0.0 left.wav -map_channel 0.0.1 right.wav
Ele fará o mesmo com qualquer formato que entenda, incluindo mp3. O exemplo divide um arquivo estéreo em dois arquivos mono, sem qualquer reencodificação. Eu suponho que todos os jogadores irão (por padrão) tocar um canal para cada orador. Você pode seguir este exemplo para criar um arquivo estéreo com o mesmo áudio copiado em ambos os canais. Para obter estéreo conjunto, você precisa re-codificar, o que (em mp3) não é sem perdas; essa página não tem um exemplo.
Se você está fazendo isso no Windows (e não usando o Cygwin), parece que a melhor fonte é o build do Zeranoe FFmpeg