Boa solução de conversão de texto em fala para o Windows [fechada]

9

Estou executando o Windows 7 e sei que ele tem a capacidade de ler textos em meus aplicativos, mas estou procurando um bom utilitário para salvar blocos de texto como um arquivo wav ou mp3. Pode já estar integrado no SO, mas disfarçado de forma inteligente. Eu sei que posso escrever um programa para chamar a API, que é o meu próximo passo, se já não houver uma boa solução.

Eu realmente gosto da qualidade do sistema AT & T , mas ele tem alguns restrições bastante íngremes no uso do MP3 produzido. Eu gostaria de usá-los no meu podcast.

Com base na Web também é OK, desde que produza facilmente um Wav, MP3 ou algum outro arquivo de áudio padrão sem restrições (Domínio público ou Creative Commons). Naturalmente eu prefiro o código aberto ou livre sobre o comercial, mas isso não é um requisito.

    
por Jim McKeeth 22.07.2009 / 04:57

2 respostas

4

Eu tentei espeak , festival e MaryTTS . Todos eles geram vozes compreensíveis em grande parte, mas não são muito naturais. Mesmo com downloads de voz adicionais para esses sistemas (por exemplo, Mbrola, CMU Arctic), as vozes não são tão boas assim.

IVONA vozes são as melhores que eu já ouvi até agora. Eles te dão uma demonstração gratuita de 30 dias, o que é suficiente se você tiver uma tarefa única para fazer. Depois disso, eles são como $ 45 / voz. A Amazon acaba de comprar a empresa para que você saiba que ela é sólida ( link ) .

Eles trabalham com a interface SAPI da Microsoft, o que significa que as vozes estão disponíveis para qualquer programa que suporte isso (por exemplo, o Adobe Reader). Eu os tenho usado com o programa Text To Wav que é bom para grandes conversão de arquivos de texto em arquivos wave.

Editar

Na verdade, basta reler sua pergunta e, para uso não pessoal (por exemplo, podcasts), o preço é provavelmente muito maior para a IVONA. Nesse caso, eu diria que confira MaryTTS.

    
por 31.01.2013 / 17:39
6

eSpeak é gratuito & open source e oferece tudo o que você precisa.

It can run as a command line program to speak text from a file or from stdin.
A shared library version is also available.

* Includes different Voices, whose characteristics can be altered.
* Can produce speech output as a WAV file.
* SSML (Speech Synthesis Markup Language) is supported (not complete),
  and also HTML.
* Compact size. The program and its data, including many languages,
  totals about 1 Mbytes.
* Can translate text to phoneme codes, so it could be adapted as a front
  end for another speech synthesis engine.
* Potential for other languages. Several are included in varying stages
  of progress. Help from native speakers for these or other languages is
  welcomed.
* Development tools available for producing and tuning phoneme data.
* Written in C++.
    
por 22.07.2009 / 05:18