Seu comando usa o hstack, mas seu erro mostra o vstack. Eu suponho que é de um comando diferente. De qualquer forma, use
-i movie.mov -filter_complex \
"color=c=black[c_s]; \
[c_s][0:v]scale2ref[c][v]; \
[c]setsar=1[cr]; \
[v][cr]hstack=shortest=1:inputs=2[combined]" \
-map "[combined]" out.mov
Embora, para esse requisito específico, você possa apenas preencher o vídeo.
-i movie.mov -vf pad=2*iw:ih:color=black out.mov