Você pode usar diretamente o ffmpeg
para detectar e extrair cenas instantaneamente sem a necessidade de imprimir e analisar informações de quadros:
ffmpeg -i foo.mp4 -vf select='gt(scene\,0.4)' -vsync vfr frame%d.png
O -vsync vfr
é necessário porque a extração de imagens não funciona com taxa de quadros variável por padrão, consulte # 1644 .