A única ferramenta que é capaz de fazer isso é provavelmente shazam ... No entanto, você não pode usá-lo para suas próprias gravações. Você pode dar uma olhada em impressão digital acústica !
Eu gostaria de fazer uma espécie de sistema de "reconhecimento de fala".
O objetivo é comparar uma nova gravação com um arquivo de áudio original e se o som for > x% similar, faça alguma coisa.
Já existe uma ferramenta fazendo algo semelhante?
A única ferramenta que é capaz de fazer isso é provavelmente shazam ... No entanto, você não pode usá-lo para suas próprias gravações. Você pode dar uma olhada em impressão digital acústica !
Bom, tenho a satisfação de apresentar o mundo do Reconhecimento de fala :) Na verdade, há muita pesquisa neste tópico, mas não há uma ferramenta que seja estabelecida em todos os sistemas UNIX. Aqui está um post com uma extensa lista de ferramentas ... mesmo quando não são ferramentas eficazes. Existe algum software decente de reconhecimento de fala para o Linux?
Para fins de comparação, você pode pesquisar sobre Dragon Naturally Speaking , o claro vencedor em sistemas Windows.
Embora essa seja uma pergunta antiga, eu vim recentemente dois arquivos de áudio que eu precisava comparar. Embora não seja um processo automatizado, usei o software Mixx e comparei as formas de onda. Se é o mesmo que as músicas são as mesmas. Caso contrário, você deve ser capaz de ver a diferença (mesmo as menores). Veja esta imagem - há duas formas de onda na parte superior e, mesmo ouvindo as mesmas músicas, as formas de onda mostram que há diferença entre elas (no entanto, as pequenas formas de onda parecem iguais);