Como posso instalar e usar software de conversão de texto em fala?

20

Eu quero converter texto em um arquivo de áudio contendo fala sintetizada que lê esse texto. Qual software gratuito (libre + gratis) está disponível para isso e como eu o instalo e uso?

Eu não preciso usá-lo como uma ferramenta de acessibilidade - eu só quero ouvir minhas notas de revisão enquanto faço outras coisas, como jogar jogos.

    
por dv3500ea 16.01.2011 / 13:20

8 respostas

18

espeak é uma boa ferramenta.

Eu apenas gosto de brincar com ele em uma linha de comando. Você pode achar que está em conflito com o Pulseaudio, por isso estou usando uma versão prolixa que nega ter que configurá-lo corretamente.

sudo apt-get install espeak
espeak --stdout "this is a test" | paplay

espeak --help mostrar-lhe-á as opções para calibrar a velocidade de leitura, tom, voz, etc.

Quando você estiver fazendo suas anotações, salve-as como um arquivo de texto e, em seguida:

echo "these are my notes" > text.txt
espeak --stdout -f text.txt > text.wav
paplay text.wav # you should hear "these are my notes"

Você pode então brincar com ffmeg et al para compactar isso do PCM para algo mais gerenciável como MP3 ou OGG. Mas essa é uma história diferente.

    
por Oli 16.01.2011 / 13:29
5

O Mbrola não funciona desde 11.10.

As ferramentas SVOX (pico) são fáceis de instalar, fáceis de usar e trazem vozes de boa qualidade no Ubuntu. Instale:

sudo apt-get install libttspico0 libttspico-utils libttspico-data

Ainda mais fácil, você pode usar o LibreOffice em combinação com as ferramentas SVOX (pico) instalando o "Read Text" extensão e você obtém um "GUI" para este excelente software TTS:

Configure as opções da Read Text Extension com Tools - Add-ons - Read selection .... Use / usr / bin / python como o programa externo. Selecione uma opção de linha de comando que inclua o token (PICO_READ_TEXT_PY).

    
por leoperbo 12.12.2013 / 20:53
3

E ainda outro gui diferente: gespeaker . Ele usa os mecanismos espeak e mbrola . Além disso, tem mais opções do que espeak-gui .

    
por luri 16.01.2011 / 16:03
3

O seguinte não é uma solução FLOSS, mas você pode achar que vale a pena. (é uma solução vinho ),

Pessoalmente, estou muito interessado em TTS, eu o uso com bastante frequência ... por exemplo. ouvindo um discurso desconexo que eu nunca me preocuparia em ficar com o otherise (porque eu preciso pegar outra xícara de café ... :)

Algumas coisas eu descobri ao longo do caminho ... ou devo dizer, coisas que eu não descobri ao longo do caminho ... Para ser franco: cada pedaço de voz TTS FOSS software que eu tentei está sob par e, portanto, inadequado para qualquer audição semi-prolongada ...

Atualmente, uso os NaturalVoices da ATnT. Ele está disponível apenas para Windows (talvez o Mac), mas é executado em wine no Ubuntu ... (ele tem um pouco menor, onde às vezes preciso clicar no painel quando me afasto) do leitor ... É uma questão menor quando comparada à vantagem obtida pela qualidade da fala do NatualVoices.

Algumas outras coisas que eu considero praticamente essenciais para uma experiência auditiva semi-sensível são: ...

  1. Esses progamas da TTS não são inteligentes (talvez tão inteligentes quanto um babuíno jovem) ... então eles precisam de toda ajuda que conseguirem. e há um (e apenas um Reader programa que eu encontrei que ajuda muito nisso. O aplicativo é chamado ReadPlease (2003 Pro) ... Ele permite que você modifique especialmente palavras e grupos de palavras para ser pronunciado como você quer que eles ... Não é de forma perfeita, mas para mim, fez a diferença entre todo o processo ser utilizável e não utilizável ...

  2. O discurso em Natural Voices é "ok", mas é um pouco chato. Existem outros bons produtos também, mas eles são todos para o Windows, infelizmente). Ele infeclts surprisingl bem às vezes .. mas OMG, inicialmente é uma dor! .. então # 2 é * paciência ... e muita atualização da sua lista de "palavras especiais" ... Por paciência, quero dizer que você (eu) realmente se acostumou com os padrões de fala do meu babuíno em particular :) ... e, a propósito, atualmente tenho cerca de 3000 palavras que agora soam "Humanas" o suficiente para que eu não me arrepie mais quando as ouço.

    3 .. "Siga a Bouncing Ball" ... Novamente porque a voz nunca é tão boa quanto um orador de verdade, as coisas às vezes precisam ser esclarecidas. O programa Reader que eu uso tem um recurso para o qual eu atendo mesmo com sua interface de aparência desajeitada .... Tem uma opção de "selecionar o que está sendo lido". Muitos leitores têm isso, mas o ReadPlease mantém a linha atual ligada centro da tela .. Isso é inestimável para poder ver a frente e o verso para reler rapidamente o que você acabou de perder (assim, a centralização automática da linha curent é boa) ...

Bem, essa é a minha experiência .. Eu vou fazer um café agora, e enquanto estiver fazendo isso, eu vou estar ouvindo isso, para ver como "lê" .... TTS é surpreendentemente bom para pegar erros (eu faço muitos erros de digitação) ...

Se algo tão bom quanto o ATnT NaturalVoices aparecer no repositório do Ubuntu, eu vou pular nele.

Aqui está um link para alguns exemplos de Vozes naturais : eu uso o "MIke"

    
por Peter.O 16.01.2011 / 16:07
3

SVOX pico2wave

é isso que eu uso. E soa natural, é fácil de entender, reconhece unidades (m, ° C, kg, ...)

Aqui está o meu primeiro post para pico2wave

Natural Sounding Text to Speech?

Tudo o que você tem é:

Vá para o Ubuntu Software Center e procure por "pico". Você encontrará 4 ou 5 entradas com "Small Footprint Ling ...". Instale-os.

Um possível uso de pico2wave é descrito em minha primeira postagem (siga o link acima).

Tchau

    
por user85321 24.08.2012 / 17:36
2

Mesmo que você já tenha aceitado uma resposta, eu queria mencionar festival , que eu também gosto bastante. Esta postagem nos fóruns do Ubuntu tem muitas informações sobre como criar vozes muito legais para isso.

    
por frabjous 16.01.2011 / 15:55
0

Balabolka under Wine funciona bem (para mim) com vozes SAPI4 (as vozes do SAPI5 não são detectadas no meu sistema Linux). Pode abrir arquivos e começar a ler.

Aqui está o link para a entrada AppDB do Wine para Balabolka: link

    
por Hemantkumar Garach 04.01.2017 / 06:01
0

Instalar: sudo apt-get install espeak Uso: echo [message] | espeak

    
por Consoli0 30.12.2017 / 18:39