Reconhecimento de voz - software MP3 to text [closed]

15

Estou à procura de um programa independente de alto-falante (comercial ou gratuito) que me permita transcrever arquivos de MP3 contendo gravações de voz (especialmente podcasts) para texto. Eu queria experimentar o Dragon Naturally Speaking, mas parece que só suporta transcrever minhas próprias gravações de fala. Então, quais são as alternativas?

    
por pako 06.04.2010 / 12:44

6 respostas

7

O Dragon Naturally Speaking importará arquivos mp3 e tentará transcrevê-los. Prefere sintonizar seu reconhecimento de voz para o falante individual, mas faz um trabalho justo sem ajuste. Provavelmente funcionaria melhor se os seus alto-falantes de podcast se parecessem com Tom Brokaw.

    
por 13.04.2010 / 22:30
4

Uma possível solução seria enviar o seu vídeo para o Youtube e experimentar as legendas automáticas que você pode ativar ... ele ainda não está muito preciso, mas você pode fazer o download do arquivo de legendas e editá-lo, se isso ajudar. ..como por questões de direitos autorais / pirataria da música, você pode tornar o vídeo privado em seu perfil, se isso for possível?

    
por 06.04.2010 / 20:42
2

Gostaria de advertir contra a tentativa de Dragon Naturally Speaking - escrevi alguns scripts no meu iphone desbloqueado para copiar / converter todos os arquivos de correio de voz do meu telefone para uma pasta no meu PC e tive o serviço de transcrição do Dragon Naturally Speaking executado contra eles.

O resultado da execução da transcrição contra arquivos com caixas de som diferentes foi absolutamente inutilizável. Eu tentei algumas das alternativas de código aberto, mas o reconhecimento de voz independente de alto-falante ainda parece limitado a dicionários muito pequenos.

    
por 20.04.2010 / 07:32
1

Estou usando o link com o podcast e vídeos em inglês e funciona muito bem. É grátis por 50 horas de áudio.

Você pode fazer o download da transcrição de áudio em rtf, srt ou pdf.

Você pode fazer o download de transcrições de máquina de cerca de 10 a 15 minutos após o upload e, às vezes, no início.

    
por 07.07.2015 / 21:44
1

Open Source: Esfinge da CMU

Shareware: link (Windows)

Comercial: Dragon NaturallySpeaking (Windows)

Você também pode tentar esse método se estiver tentando usar o que pode ser feito usando audacity e soundflower

Você também pode encontrar alguns links relevantes para opensource que outro shareware vale a pena tentar foi voxcribecc

Se você é um programador de .net, pode usar este method para criar seu próprio kit

    
por 09.07.2015 / 15:21
0

O Podzinger seria uma ótima solução, mas não tenho certeza de que a rampa (o novo nome da empresa que costumava ser a EveryZing, que produzia o Podzinger) oferece o serviço de graça ...

link

    
por 06.04.2010 / 17:57