Eu encontrei a resposta que Shane forneceu para fornecer muito pouco dos outros canais e demais do centro. Filmes com fones de ouvido soaram desequilibrados, com todos os diálogos e música / efeitos de fundo insuficientes.
De acordo com os padrões ATSC (seção 7.8, página 91) A fórmula a seguir é usada para fazer downmix de 5.1 para estéreo convencional (em oposição a matriz):
Lo = 1.0 * L + clev * C + slev * Ls ;
Ro = 1.0 * R + clev * C + slev * Rs ;
clev e slev devem ser 0,707, de acordo com as tabelas 5.9 e 5.10 do documento supracitado, assumindo um nível de mix center / surround de 0. Outros valores são fornecidos nessas tabelas, o que reduz a quantidade de mix center, que eu encontre útil.
Com isto em mente, a seguinte opção ffmpeg produz um bom som balanceado com diálogo audível. Observe que especificar os canais de áudio não é necessário.
-af "pan=stereo|FL < 1.0*FL + 0.707*FC + 0.707*BL|FR < 1.0*FR + 0.707*FC + 0.707*BR"
Uma observação sobre o uso do símbolo de menor que, da documentação do filtro de panorâmica :
If the ‘=’ in a channel specification is replaced by ‘<’, then the gains for that specification will be renormalized so that the total is 1, thus avoiding clipping noise.