Você deve verificar se a parte de vídeo é realmente um fator separando os componentes A / V
com ffmpeg isso funciona com
#retrieve audio-only
ffmpeg -i <<VideoName>> -vn -acodec copy -f <<AudioCodec>> output.audio
#retrieve video-only
ffmpeg -i <<VideoName>> -an -vcodec copy -f <<VideoCodec>> output.video
Se o vídeo for realmente significativo em tamanho, uma possibilidade seria criar uma captura de tela e usar a imagem como entrada para o codificador de vídeo, em vez de recodificar o videostream
veja ffmpeg.org/wiki para referência
#create screenshot from video
ffmpeg -i <<VideoName>> -ss 00:00:01.0 -f image2 -vframes 1 output.screen.png
Você pode ver neste post do stackoverflow como fazer um vídeo a partir de um still