Se você quiser apenas selecionar uma voz antes de fazer o TTS, use text2wave
echo 'hello world' | text2wave -eval '(voice_kal_diphone)' > hello.wav
text2wave é um script do Festival propriamente dito, por isso você pode facilmente customizá-lo.
Você pode fazer semelhante com a linha de comando do Festival:
festival '(voice_ked_diphone)' '(SayText "hello world")' '(exit)'
mas infelizmente não funciona junto com a opção --tts
.