Natural Texting Sound to Speech?

75

Estou procurando um software de texto para fala fácil de instalar para o Ubuntu que pareça natural. Eu instalei Festival , Gespeaker , etc., mas nada soa muito natural. Tudo muito sintético e difícil de entender.

Alguma recomendação por aí?

    
por I Heart Ubuntu 20.07.2011 / 19:36

13 respostas

17

Acredito que encontrei o melhor software TTS gratuitamente usando uma extensão do Google Chrome chamada "SpeakIt". Isso só funciona no navegador Chrome para mim no Ubuntu. Não funciona com o Chromium por algum motivo. SpeakIt vem com duas vozes femininas que soam muito realistas em comparação com tudo o que existe por aí. Existem pelo menos mais quatro machos & amp; vozes femininas listadas s extensões do Chrome se você pesquisar na Chrome Web Store usando "TTS" como sua consulta.

link

Para uso em um site. Destaque o texto que deseja ler e clique com o botão direito do mouse em "SpeakIt" ou clique no ícone SpeakIt encaixado na barra superior do Chrome.

Os usuários do Firefox também têm duas opções. Dentro dos addons do Firefox, faça uma busca por TTS e você deve encontrar "Click Speak" e também "Text to Voice". As vozes não são tão boas quanto as vozes do Chrome SpeakIt, mas são definitivamente utilizáveis.

A extensão SpeakIt usa a tecnologia iSpeech e, por um preço de US $ 20 por ano, o site pode converter texto em arquivos de áudio MP3. Você pode inserir texto, URLs, feeds RSS, bem como documentos como TXT, DOC e PDF, e enviar para MP3. Você pode fazer podcast, incorporar áudio, etc. Aqui está um link ...

link

e uma amostra do seu áudio (não sei quanto tempo o link durará) ...

link

    
por I Heart Ubuntu 27.01.2013 / 01:11
45

SVOX pico2wave

Além das outras respostas:

Um TTS muito minimalista, um som melhor que o do espeak ou mbrola (na minha opinião).

Algumas informações: link

Eu não entendo porque pico2wave é, comparado ao espeak ou mbrola, raramente discutido. É pequeno, mas parece muito bom (natural). Sem modificação, você ouvirá uma voz feminina natural.

E ... comparado ao Mbrola, ele reconhece as Unidades e fala da maneira certa!
Por exemplo:

  • 2 ° C → dois graus
  • 2m → dois metros
  • 2kg → dois quilos

Após a instalação, eu o uso em um script:

#!/bin/bash
pico2wave -l=de-DE -w=/tmp/test.wav ""
aplay /tmp/test.wav
rm /tmp/test.wav

Em seguida, execute-o com o texto desejado:

<scriptname>.sh "hello world"

ou leia o conteúdo de um arquivo inteiro:

<scriptname>.sh "$(cat <filename>)"

Isso é tudo para ter um TTS de trabalho leve e estável no Ubuntu.

    
por user85321 24.08.2012 / 17:12
11

Simple Google ™ TTS

Por causa da falta de uma alternativa melhor, eu escrevi um script bash que faz interface com um script perl de Michal Fapso para fornecer TTS via Google Translate. A partir da descrição do projeto:

  

A intenção é fornecer uma interface fácil de usar para saída de texto em voz via sistema de síntese de voz do Google. Uma opção de fallback usando pico2wave fornece automaticamente a síntese de TTS, caso não seja encontrada conexão com a Internet.

     

Tal como está, o wrapper suporta a leitura de arquivos de entrada padrão, arquivos de texto simples e a seleção X (texto destacado).

As principais características são:

  • síntese de TTS on-line por meio do Google translate
  • síntese de TTS off-line via pico2wave
  • suporta uma variedade de idiomas diferentes
  • pode ler da CLI, arquivos de texto e texto realçado
  • suporta a leitura de texto destacado com formatação fixa (por exemplo, arquivos PDF)

A instalação e o uso estão documentados na página do projeto .

Eu ficaria feliz se você fizesse uma tentativa. Relatórios de bugs e qualquer outro feedback são bem-vindos!

    
por Glutanimate 23.08.2014 / 21:18
8

Eu olhei alto e baixo para o texto em fala para o Ubuntu que é de alta qualidade. Não há nenhum. Minhas cordas vocais estão paralisadas, então eu precisava do TTS para adicionar instruções de voz aos meus vídeos do Ubuntu . Você pode obter o software comercial de texto para fala Linux de alta qualidade aqui: link É muito caro. Acabei comprando o Natural Reader for Windows (não funciona no Ubuntu com o Wine) por US $ 40. Talvez mais tarde eu tenha o Linux.

Espero que ajude.

    
por Joe Steiger 20.07.2011 / 19:57
6

Eu venho realizando pesquisas sobre o melhor som e texto facilmente sintonizado para as vozes da fala. Abaixo está uma lista do que eu considero os 5 principais produtos em ordem de qualidade de som. A maioria dos sites associados a esses produtos tem uma demonstração interativa que permitirá que você faça sua própria determinação.

  1. NeoSpeech
  2. iVona
  3. Acapela
  4. AT & T Natural vozes
  5. Vozes CereProc
por Jim 24.04.2012 / 17:35
6

O Pico e o Espeak são divertidos e fáceis de trabalhar, mas não são tão bons assim. As vozes padrão do Festival também não são boas. No entanto, o Festival é uma estrutura de discurso baseada em esquemas, na qual vários pesquisadores criaram vozes de plug-in muito melhores. Você pode facilmente superar a qualidade pico2wave no Ubuntu, porque uma dessas vozes está disponível como um pacote pronto.

Para que o festival pareça natural, eis o que fazer:

sudo apt-get install festival
sudo apt-get install festvox-us-slt-hts
festival -i
festival> (voice_cmu_us_slt_arctic_hts) 
festival> (SayText "Don't hate me, I'm just doing my job!")

Você pode fazer isso a partir da linha de comando usando -b (ou --batch ) e colocando cada comando entre aspas simples:

festival -b '(voice_cmu_us_slt_arctic_hts)' \
    '(SayText "The temperature is 22 degrees centigrade and there is a slight breeze from the west.")'

Você pode obter outras vozes muito boas do repositório da Nitech, mas instalá-las é meticuloso, e os caminhos padrão alterados para que as referências de nome de arquivo nos arquivos de esquema possam precisar ser editadas manualmente para funcionar no Ubuntu.

    
por Jon Watte 25.04.2017 / 21:31
5

Combine ferramentas SVOX (pico) com o LibreOffice:

As ferramentas SVOX (pico) são fáceis de instalar e trazem vozes de boa qualidade no Ubuntu. Instale:

sudo apt-get install libttspico0 libttspico-utils libttspico-data

Você pode usar o LibreOffice em combinação com as ferramentas SVOX (pico) instalando a extensão "Read Text" e você obtém um "GUI" para este excelente software TTS:

Configure as opções da Read Text Extension com Tools - Add-ons - Read selection. ... Use / usr / bin / python como o programa externo. Selecione uma opção de linha de comando que inclua o token (PICO_READ_TEXT_PY) , você pode experimentar alguns deles.

Agora, você só precisa selecionar um texto em LO Writer, Calc, Impress ou Draw e clicar no ícone adicionado como uma barra de ferramentas (um rosto feliz com um balão).

    
por leoperbo 15.12.2013 / 01:48
4

Acho as vozes da Nitech HTS no festival muito naturais e reconfortantes em relação a quaisquer outras vozes que ouvi. Veja este link sobre como configurar o Nitech e outros sons com o festival. Eu não encontrei um bom gui que eu possa usar para configurar essas vozes, mas defini-las via festival.scm ainda funciona. Essa postagem é muito antiga e você pode querer encontrar o diretório de instalação real usando comando "localizar festival"

    
por razor 09.11.2011 / 14:56
4

Aqui está o que eu fiz para ter discurso natural puro para arquivos pdf e outros arquivos de texto (outras soluções não são naturais ou são apenas serviços pagos). Este é realmente um trabalho em torno de usar cromo ou cromo, mas funciona rápido e fácil.

  1. Instale a extensão SpeakIt! no seu cromo ou cromo.
  2. Instale o Visualizador de PDF se você estiver usando o cromo (o chrome já possui um pdf visualizador gratuito) e marque as opções "Permitir em modo anônimo" e "Permitir acesso a URLs de arquivo" nas configurações de extensões do chromium.
  3. Arraste e solte seu PDF para o navegador.
  4. Agora, destaque algum texto, clique com o botão direito e selecione SpeakIt! para que você possa ouvir a conversão de texto em voz natural pura.

Também há maneiras de abrir outros arquivos como .doc e .txt no chrome e fazer o mesmo. Existem outras extensões para o chrome que visualizam arquivos pdf, verifique se você se encaixa melhor. Além disso, você pode fazer upload de todos os tipos de textos no Google Drive e usar o SpeakIt! ler para você. Outra extensão chamada "Fale o texto" funciona da mesma maneira e tem fala natural.

    
por Pooya Sanooei 12.12.2013 / 02:54
2

ao procurar por um motor tts melhor para usar com o novo modo narrativo do firefox 49 eu encontrei pico tts (svox) - meu mecanismo TTS favorito.

sudo apt install espeak libttspico0 libttspico-data libttspico-utils

Como alterar o sistema de mecanismo de síntese de fala padrão?

As pessoas no arch linux me trouxeram para o caminho certo ( link ):

Descomente o módulo que você gosta e torne-o padrão nas configurações do discador de fala:

#> vim /etc/speech-dispatcher/speechd.conf

[...]
# -----OUTPUT MODULES CONFIGURATION-----
# Each AddModule line loads an output module.
#AddModule "espeak"       "sd_espeak"   "espeak.conf"
AddModule "pico-generic"  "sd_generic"   "pico-generic.conf"

[...]
#DefaultModule espeak
DefaultModule pico-generic

Reinicie o daemon:

#> sudo systemctl restart speech-dispatcher.service

MAS, ao iniciar o firefox novamente, nada acontece. De acordo com o link acima (arch forum post # 10 e # 16) trabalha com festival (não tente), mas o speech-dispatcher para pico não lista as vozes disponíveis. Não será executado.

Qualquer ideia lá fora seria muito apreciada; -)

    
por apos 14.11.2016 / 23:55
1

Meu programa favorito de conversão de texto em fala é chamado de Magic English, mas como o Natural Reader mencionado por Joe Steiger, é um programa do Windows e não tenho certeza se ele será executado no Wine.

A AT & T Natural Voices está disponível on-line como uma demonstração, mas isso é mais um trabalho ao redor do que uma solução ...

    
por Chris Granger 20.07.2011 / 21:10
0

Para isso, eu palestrante inteligente - extensão do Google Chrome. Pode ler páginas mesmo sem seleção (quando a detecção de texto está correta).

    
por Vitaly Zdanevich 16.09.2017 / 20:02
0

Google TTS

Pico, mbrola, cmu, festival, flite, todos chupam em 2017 (Eles foram incríveis nos anos 90). O discurso natural do AT & T (que é fantástico) não é compatível com o linux e não é grátis, por isso usamos o Google

git clone https://github.com/Glutanimate/simple-google-tts.git
sudo apt install xsel libnotify-bin libttspico0 libttspico-utils libttspico-data libwww-perl libwww-mechanize-perl libhtml-tree-perl so$
cd simple-google-tts
sudo ln -s 'pwd'/simple_google_tts /usr/local/bin
simple_google_tts en "Text to speech is now installed"
cd -
    
por Jonathan 29.11.2017 / 06:32