Isso pode ser feito de maneira indireta.
Use
ffmpeg -i deskshare.webm -i webcams.webm -filter_complex
"[1:v][0:v]scale2ref=main_w:ih[sec][pri];
[sec]setsar=1,drawbox=c=black:t=fill[sec];[pri][sec]hstack[canvas];
[canvas][1:v]overlay=main_w-overlay_w" out.mp4
O scale2ref redimensiona uma cópia do vídeo secundário para a altura do vídeo principal, mantendo a largura original. Depois é preenchido com preto e empilhado à direita do vídeo principal.
Uma segunda cópia do vídeo secundário é então sobreposta na tela expandida.
Você precisará do ffmpeg 4.0 ou mais recente.