Existe uma diferença entre a razão de aspecto da amostra (SAR) e a razão de aspecto da exibição (DAR). Se você quiser alterar o vídeo para exibir em 4: 3, será necessário alterar os pixels reais na imagem (dimensionando os pixels e alterando o SAR) ou definindo um sinalizador de metadados no nível do contêiner que diz ao externo media players para esticar a imagem para o seu DAR desejado.
Você não poderá dimensionar os pixels e alterar o SAR sem aplicar um filtro de vídeo. Se você escolher esse método, será necessário transcodificar o arquivo, pois não é possível "transmitir" o fluxo de vídeo durante a aplicação de um filtro de vídeo.
Para dimensionar a imagem e alterar o SAR (durante a transcodificação), tente:
ffmpeg -i <INPUT_FILE> -vf scale=720:540 -c:v <Video_Codec> <OUTPUT_FILE>
Por outro lado, se você quiser apenas alterar o sinalizador de metadados e ajustar o DAR, será possível transmitir o vídeo. Para fazer isso, tente:
ffmpeg -i [INPUT] -aspect 720:540 -c copy [OUPTPUT]