Se você primeiro converter o vídeo em uma série de imagens raw rgb24 ou rgb32, talvez consiga obter o número correto de quadros, pois na forma original parece haver tipos de quadros incomuns que podem não ser imagens em tudo ???
Nos discos a laser originais, o vídeo inteiro era composto de uma série de imagens com números individuais de quadros de 1 a 100.000 ou mais, e assim é realmente a maneira correta de estabelecer uma linha de base para futuras conversões ou manipulações.
O setor mudou para essa estranha ideia de compactação simplesmente para reduzir o dinheiro investido e para corromper as verdadeiras formas científicas de lidar com números.
Você deve primeiro extrair qualquer áudio como um arquivo wave para não perder totalmente o áudio. Parece que o FFMPEG coloca informações de identificação em cada imagem extraída, porque se você tentar juntar imagens de outras extraídas, e você misturar outras imagens de outras fontes com a mesma extensão, o ffmpeg irá ignorar as imagens que você tentou colocar no meio de tudo .
Com o formato de disco laser, a taxa de quadros é simplesmente ditada por qualquer taxa que você apresente as imagens seqüenciais e não seja controlada de forma alguma pelas próprias imagens.
O FFMPEG pode aprender com a ciência, em vez da arte, para o manuseio e exibição de imagens de qualquer tipo. Ou possivelmente toda a indústria de AV. A indústria realmente precisa melhorar os recursos do hardware e usar dados brutos que exigem muita memória / armazenamento. Nada supera dados brutos para precisão e precisão.