Eu tenho um mp4 com legendas codificadas e quero fazer um arquivo SRT.
Eu tentei usar o software de OCR de vídeo AviSub. Ele tem o tempo certo, mas as palavras em si eram muito imprecisas, então eu tenho um arquivo SRT que se parece com isso:
1
00:01:22,277 --> 00:01:27,271
innacurate text
innacurate text
2
00:01:38,501 --> 00:01:41,668
innacurate text
Agora que eu tenho os horários, quero:
Use o ffmpeg para extrair um quadro de cada um desses timings (não sei como fazer isso).
Lote o OCR em todos os quadros com um software OCR preciso, como o Readiris (cada quadro em um arquivo txt separado).
Use um script Python para substituir as legendas no arquivo SRT antigo pelas corretas de cada novo arquivo de texto criado.
Obrigado