Na teoria, você precisará criar seu próprio aplicativo para fazer isso. Você precisará fazer isso:
-
Execute o arquivo WAV por meio de um mecanismo de reconhecimento de fala O Sphinx Speech Recognition é um mecanismo de código-fonte aberto gratuito.
-
Faça com que o seu mecanismo de reconhecimento de fala cuspa o texto em tempo real na memória e também rastreie a localização do tamanho da amostra. Toda vez que a string “deux radio” for encontrada, envie o local da amostra para um arquivo
splitlog.txt
. Como isso é em tempo real, você obtém uma aproximação da localização da amostra. -
Escreva seu próprio aplicativo divisor wav: Reúna todos os pontos de localização de amostra de
splitlog.txt
e divida o WAV de acordo.