O filtro loudnorm usa janelas (sobrepostas) de 3 segundos de áudio para calcular a intensidade sonora de curto prazo na fonte e ajustar o destino para atender aos parâmetros de destino. O arquivo de amostra é apenas um segundo longo, o que parece ser o motivo da normalização anômala.
Se eu colocar o áudio em 3 segundos e rodar,
ffmpeg -i in.wav -af apad,atrim=0:3,loudnorm=I=-16:TP=-1.5:LRA=11:measured_I=-23.54:measured_TP=-7.96:measured_LRA=0.00:measured_thresh=-34.17:offset=7.09:linear=true:print_format=summary -ar 16k pad-out.wav
loudnorm funciona como esperado.
Input Integrated: -23.8 LUFS
Input True Peak: -8.0 dBTP
Input LRA: 0.2 LU
Input Threshold: -36.0 LUFS
Output Integrated: -15.9 LUFS
Output True Peak: -1.5 dBTP
Output LRA: 0.0 LU
Output Threshold: -26.7 LUFS
Normalization Type: Dynamic
Target Offset: -0.1 LU
Para recuperar o comprimento original, você pode executar o comando acima com um filtro de compensação no final
ffmpeg -i in.wav -af apad,atrim=0:3,loudnorm=I=-16:TP=-1.5:LRA=11:measured_I=-23.54:measured_TP=-7.96:measured_LRA=0.00:measured_thresh=-34.17:offset=7.09:linear=true:print_format=summary,atrim=0:1.0 -ar 16k trimmed-out.wav
em que o segundo argumento a atrim é a duração original, em segundos.