Eu tentei espeak , festival e MaryTTS . Todos eles geram vozes compreensíveis em grande parte, mas não são muito naturais. Mesmo com downloads de voz adicionais para esses sistemas (por exemplo, Mbrola, CMU Arctic), as vozes não são tão boas assim.
IVONA vozes são as melhores que eu já ouvi até agora. Eles te dão uma demonstração gratuita de 30 dias, o que é suficiente se você tiver uma tarefa única para fazer. Depois disso, eles são como $ 45 / voz. A Amazon acaba de comprar a empresa para que você saiba que ela é sólida ( link ) .
Eles trabalham com a interface SAPI da Microsoft, o que significa que as vozes estão disponíveis para qualquer programa que suporte isso (por exemplo, o Adobe Reader). Eu os tenho usado com o programa Text To Wav que é bom para grandes conversão de arquivos de texto em arquivos wave.
Editar
Na verdade, basta reler sua pergunta e, para uso não pessoal (por exemplo, podcasts), o preço é provavelmente muito maior para a IVONA. Nesse caso, eu diria que confira MaryTTS.