Use
ffmpeg -i video -i audio -filter_complex "[0:a:1][1:a]amix[a]" -map 0:v -c:v copy -map "[a]" -c:a aac output.mp4
O filtro amix misturará a 2ª faixa de áudio do vídeo com o áudio da segunda entrada. A duração do áudio será igual à duração da faixa de áudio mais longa na mixagem.