Funciona para mim. Se você não removeu o Pulseadio (sistema de áudio padrão do Ubuntu e substituição de ESD), você pode ter mais sucesso em fazer isso:
pasdp em vez de esddsp:
echo '(SayText "hello world")' | padsp festival --pipe
Pulseaudio's automagic alsa swallower:
festival '(SayText "hello world")'