Use a opção sox silence
:
sox [input] [output] silence 1 1 2% -1 0.5 2%
reduzirá o silêncio na frente para 1 segundo e reduzirá as lacunas para meio segundo no arquivo. 2% no meu caso ignora o noise floor. 0% pode funcionar para você.
-1
diz ao sox para lidar com cada instância.