Acho que sox
precisa buscar sua entrada para determinar o formato de entrada do cabeçalho do arquivo e isso é incompatível com um canal.
Eu acho que o ffmpeg pode fazer tudo o que você quiser, embora eu não tenha certeza. Eu não estou familiarizado com isso e a documentação é clara como lama.
ffmpeg -i "$input" -compression_level 9 -ac 2 -ab 44100 output.flac
Alternativamente, o mencoder deve ser capaz de fazer um trabalho similar.
mencoder "$input" -oac lavc -lavcopts=acodec=flac:abitrate=44.1:o=compression_level=9 -af channels=2 output.flac