Seria
-i test.mp4 -i img.png -filter_complex [1][0]scale2ref[i][m];[m][i]overlay,setpts=0.12*PTS[v];[0:a]atempo=2.0,atempo=2.0[a] -map [v] -map [a] -ac 2 test23.mp4
Você está diminuindo o áudio em 4x, mas o vídeo em mais de 8x. Você provavelmente deseja corrigir uma das operações.