Criador da transcrição OU Fala para texto [fechado]

3

Eu ouço um podcast diário com cerca de 4 horas de duração. Eu acho que seria um projeto legal se eu pudesse vir com alguma maneira de gerar transcrições automaticamente. Existe algum software que "escute" os mp3s e crie texto do que eles estão dizendo?

Não estou muito preocupado em diferenciar quem está falando porque acho que isso seria pedir demais. Existem 4 pessoas principais falando e outras com menos frequência.

    
por AndyMcKenna 22.07.2009 / 06:36

7 respostas

-1

Tenho certeza de que o Dragon permitirá que você faça isso. Você pode ter problemas com a precisão.

    
por 22.07.2009 / 08:01
3

Etapas:

  1. Faça o download do Express Scribe do player de transcrição gratuito e instale-o.
    1. Quando o aplicativo estiver instalado, você encontrará um exemplo de arquivo de ditado já carregado. Isso lhe dará a oportunidade de brincar com os controles e opções para configurar o aplicativo de acordo com suas necessidades.
    2. Na interface principal, clique no botão Configurações.
    3. Express Scribe permite que você altere ou defina alguns parâmetros, incluindo retrocesso e velocidade de avanço rápido, teclas de atalho para todo o sistema (para controlar o aplicativo sem usar o mouse), configuração de um pedal de controle (se você tiver um), Carregamento automático de arquivos de uma pasta LAN ou Servidor FTP, escolha de tipos de arquivos para permitir (mais de 20 suportados) e configuração de um Mecanismo de Reconhecimento de Fala.
    4. Depois de ter suas opções configuradas, agora você pode carregar seu primeiro arquivo de áudio. Dependendo de onde você está recebendo de você pode clicar em Carregar (ele irá abrir uma caixa de diálogo que lhe permitirá procurar o arquivo em seu PC), carregar agora (se você tiver configurado uma conexão LAN ou FTP) ou Dock (se você tiver um gravador de ditado digital ou cassete com você).
    5. Selecione o arquivo de áudio na janela da interface principal e clique no botão Reproduzir para iniciar. Se necessário, diminua a velocidade ou acelere a reprodução de áudio usando o controle de velocidade no canto inferior direito. Acima deste controle, você também pode ajustar o volume de reprodução.
    6. Se preferir que o Express Scibe flutue acima do seu aplicativo de processamento de texto, você pode escolher o Scribe Mini na barra de ferramentas da interface principal. Como o nome sugere, esta opção fornece uma versão mínima do aplicativo.
    7. Quando terminar de transcrever seus arquivos de áudio, marque-os como "Concluído" (removendo o arquivo da sua lista) ou "Dispatch" (retornando e envie por e-mail ao remetente original junto com o anexo trext e removendo o arquivo de áudio da sua lista.

Dicas

  • Reserve algum tempo para explorar todas as opções do aplicativo.
  • Se você receber um arquivo de áudio de baixa qualidade, poderá escolher Processos de áudio especiais no menu Arquivo para tentar limpá-lo.
  • Quando o Express Scribe recebe um arquivo de áudio, ele é armazenado em C: \ Documents and Settings \ nome do usuário \ Dados de aplicativos \ NCH Swift Sound \ scribe \ Current
  • Se você marcou um arquivo de áudio como "Concluído", mas deseja recebê-lo, pode Recuperar arquivos antigos no menu Arquivo.
por 26.11.2009 / 19:08
1

Uma coisa que você pode experimentar (embora não diariamente) é enviar o áudio como um vídeo para o YouTube, pedir ao YouTube para transcrever o vídeo, legendas em inglês ... pode levar até 24 horas para o YouTube faça isso, no entanto ... O arquivo de legenda pode ser baixado e você mesmo pode editá-lo, assim você pode copiar e colar o texto onde quiser ...

    
por 10.04.2010 / 08:40
0

Você precisa de um software de reconhecimento de fala .

Existem vários programas para isso, mas não conheço nenhum que possa fazer conversões em lote. Tenho certeza que é uma característica de pelo menos um deles embora. Note que a maioria deles está longe de ser barata.

    
por 30.09.2009 / 19:59
0

Tentou acenar para o texto ? É apenas para o Windows e tem um período de teste gratuito limitado.

Quantas vozes existem nesses arquivos? Todos os arquivos contêm o discurso de uma voz (treinável)? Qual a qualidade do áudio? Se as respostas a estas perguntas não forem: 'Apenas eu', 'Sim' e 'Qualidade do CD', o @Snark está certo, você precisa fazer isso essencialmente manualmente. Obtenha um bom programa de reconhecimento de fala, passe algum tempo treinando-o e reproduza seus arquivos enquanto tenta dizer o que eles dizem.

Espere cerca de 90% - 95% de transcrição bem-sucedida, o que parece ótimo até você perceber que significa que 1 ou 2 de cada 20 palavras estão erradas.

Outros fatores que podem afetar a precisão:

  1. Muitos acrônimos em seu discurso
  2. frases incompletas - a fala para o texto tende a ter um desempenho muito melhor com as pistas contextuais que recebe de frases completas.
por 01.10.2009 / 01:09
0

Estou usando Dragon NaturalSpeaking para transcrição. excelente software!

mas não é grátis, a Amazon oferece a versão 10 real por US $ 45 , se você olhar em sua volta vai ter DNS9 ainda mais barato.

    
por 01.10.2009 / 01:32
0

O problema com o Dragon Naturally Speaking em um contexto como este é que você realmente não seria capaz de passar pelo processo de treinamento, aprendendo a interpretar com precisão o discurso. Não é destinado a esse tipo de uso. Talvez a NSA tenha algum software para fazer esse tipo de coisa. :)

    
por 10.04.2010 / 07:06