Extraindo legendas embutidas como este trabalho?

1

Eu tenho um mp4 com legendas codificadas e quero fazer um arquivo SRT.

Eu tentei usar o software de OCR de vídeo AviSub. Ele tem o tempo certo, mas as palavras em si eram muito imprecisas, então eu tenho um arquivo SRT que se parece com isso:

1
00:01:22,277 --> 00:01:27,271
innacurate text
innacurate text
2
00:01:38,501 --> 00:01:41,668
innacurate text

Agora que eu tenho os horários, quero:

  1. Use o ffmpeg para extrair um quadro de cada um desses timings (não sei como fazer isso).

  2. Lote o OCR em todos os quadros com um software OCR preciso, como o Readiris (cada quadro em um arquivo txt separado).

  3. Use um script Python para substituir as legendas no arquivo SRT antigo pelas corretas de cada novo arquivo de texto criado.

Obrigado

    
por chicago1356 15.03.2018 / 00:32

0 respostas