Tenho certeza de que o Dragon permitirá que você faça isso. Você pode ter problemas com a precisão.
Eu ouço um podcast diário com cerca de 4 horas de duração. Eu acho que seria um projeto legal se eu pudesse vir com alguma maneira de gerar transcrições automaticamente. Existe algum software que "escute" os mp3s e crie texto do que eles estão dizendo?
Não estou muito preocupado em diferenciar quem está falando porque acho que isso seria pedir demais. Existem 4 pessoas principais falando e outras com menos frequência.
Tenho certeza de que o Dragon permitirá que você faça isso. Você pode ter problemas com a precisão.
Etapas:
Dicas
Uma coisa que você pode experimentar (embora não diariamente) é enviar o áudio como um vídeo para o YouTube, pedir ao YouTube para transcrever o vídeo, legendas em inglês ... pode levar até 24 horas para o YouTube faça isso, no entanto ... O arquivo de legenda pode ser baixado e você mesmo pode editá-lo, assim você pode copiar e colar o texto onde quiser ...
Você precisa de um software de reconhecimento de fala .
Existem vários programas para isso, mas não conheço nenhum que possa fazer conversões em lote. Tenho certeza que é uma característica de pelo menos um deles embora. Note que a maioria deles está longe de ser barata.
Tentou acenar para o texto ? É apenas para o Windows e tem um período de teste gratuito limitado.
Quantas vozes existem nesses arquivos? Todos os arquivos contêm o discurso de uma voz (treinável)? Qual a qualidade do áudio? Se as respostas a estas perguntas não forem: 'Apenas eu', 'Sim' e 'Qualidade do CD', o @Snark está certo, você precisa fazer isso essencialmente manualmente. Obtenha um bom programa de reconhecimento de fala, passe algum tempo treinando-o e reproduza seus arquivos enquanto tenta dizer o que eles dizem.
Espere cerca de 90% - 95% de transcrição bem-sucedida, o que parece ótimo até você perceber que significa que 1 ou 2 de cada 20 palavras estão erradas.
Outros fatores que podem afetar a precisão:
Estou usando Dragon NaturalSpeaking para transcrição. excelente software!
mas não é grátis, a Amazon oferece a versão 10 real por US $ 45 , se você olhar em sua volta vai ter DNS9 ainda mais barato.
O problema com o Dragon Naturally Speaking em um contexto como este é que você realmente não seria capaz de passar pelo processo de treinamento, aprendendo a interpretar com precisão o discurso. Não é destinado a esse tipo de uso. Talvez a NSA tenha algum software para fazer esse tipo de coisa. :)