Tentar dividir um arquivo de áudio baseado em algum tipo de reconhecimento de fala e comparar com o conteúdo de um arquivo de texto será uma tarefa bastante árdua.
Se houver pausas suficientes (seções silenciosas) entre as palavras, você poderá usar isso para dividir o arquivo em seções. Por exemplo, no Audacity, vá para Edit -> Clip Boundaries -> Detach at Silence
[1] . No entanto, isso só será dividido em silêncio absoluto, o que é impossível de obter durante a gravação. Você precisará usar um filtro como o Noise Gate para zerar o áudio durante esses segmentos. / p>