É melhor fazer isso em duas etapas.
O primeiro passo cria um arquivo de imagem com alfa, usando a transição:
ffmpeg -framerate 30 -loop 1 -t 5 -i 1.jpg -i 3D_Transition_02.mp4
-filter_complex "[0]format=rgba,scale=1280:720,split[img][a];
[1]format=rgb24,negate,scale=1280:720[tr];
[a][tr]overlay=format=gbrp[al];
[img][al]alphamerge,setsar=1,format=yuva444p"
-an -c:v libvpx -crf 10 -b:v 0 -quality realtime -auto-alt-ref 0 a1vp8.mkv
Isso cria um arquivo de imagem fixa de 5 segundos com o efeito de transição de 1,75 adicionado como um canal alfa no início. Você não poderá ver o canal alfa em players comuns.
Na segunda etapa, esses vídeos de imagens processadas podem ser combinados
ffmpeg -c:v libvpx -i a1vp8.mkv -c:v libvpx -i a2vp8.mkv
-filter_complex "[1]setpts=PTS+3.25/TB[a2];
[0][a2]overlay" out.mp4
Como a duração da transição é de 1,75s, deve haver um tempo de sobreposição entre as duas imagens. Então, os timestamps da segunda entrada estão atrasados para iniciar em 3,25s.
Para 5 entradas preparadas da mesma maneira, use
ffmpeg -c:v libvpx -i a1vp8.mkv -c:v libvpx -i a2vp8.mkv -c:v libvpx -i a3vp8.mkv
-c:v libvpx -i a4vp8.mkv -c:v libvpx -i a5vp8.mkv
-filter_complex "[1]setpts=PTS+3.25/TB[a2];
[2]setpts=PTS+6.50/TB[a3];
[3]setpts=PTS+9.75/TB[a4];
[4]setpts=PTS+13.00/TB[a5];
[0][a2]overlay[o2];
[o2][a3]overlay[o3];
[o3][a4]overlay[o4];
[o4][a5]overlay" out.mp4