Use
ffmpeg \
-i images/25_test/31630738_0.jpg \
-loop 1 -i images/25_test/31630738_4.jpg \
-filter_complex \
"[0:v]format=yuva420p,scale=iw*10:ih*10,zoompan=z='min(zoom+0.0015,1.5)':d=250:x='iw/2-(iw/zoom/2)':y='ih/2-(ih/zoom/2)':s=640x480[first]; \
[1:v]format=yuva420p,fade=t=in:st=0:d=1:alpha=1,trim=0:10,setpts=PTS+9/TB[second]; \
[first][second]overlay" out.mp4
O zoompan continua no crossfade. O yuva420p
para a primeira imagem não é realmente de fato; adicionado apenas para melhorar a velocidade (um pouco).
O comando acima funciona para mim como está, mas, conforme os comentários, é possível adicionar fifo
aos filterchains para evitar quedas de quadros com processadores lentos ou imagens muito grandes.
[0:v]format=yuva420p,scale=iw*10:ih*10,zoompan=z='min(zoom+0.0015,1.5)':d=250:x='iw/2-(iw/zoom/2)':y='ih/2-(ih/zoom/2)':s=640x480,fifo[first]; \
[1:v]format=yuva420p,fade=t=in:st=0:d=1:alpha=1,trim=0:10,setpts=PTS+9/TB,fifo[second];