Você quer Sound eXchange aka SoX . Aqui está um exemplo de conversão de WAV para VOX ( fonte ):
sox input.wav -r 8000 -c 1 output.vox vol 1.0 polyphase stat
Veja a página do SoX e formatos de arquivo suportados .
Note que a sintaxe geral do sox é:
sox [global-options] [input-format-options] infile1 [... infile2]
[output-format-options] outfile [effect [effect-options]
Portanto, no exemplo acima, -r 8000 -c 1
são opções de formato para o arquivo VOX de saída.
Você provavelmente não precisará de opções de arquivo de entrada para dados de MP3, pois o SoX pode ler isso no cabeçalho do arquivo.