A resposta, conforme determinada, recodificará (com perda) o áudio e o vídeo do arquivo de entrada, e selecionará apenas uma única faixa de áudio e vídeo (portanto, se você tiver vários idiomas, será S-O-L). A maneira correta de fazer isso em moderno ffmpeg (ou avconv para usuários do Ubuntu / Debian, a mesma sintaxe) é:
ffmpeg -i input.avi -i input.srt -map 0 -map 1 -c copy output.mkv
O MKVmerge, uma parte do mkvtoolsnix, também pode fazer isso perfeitamente
mkvmerge -o output.mkv input.avi subtitle.srt