Use um valor mais alto -r 5
ou, se você souber a duração da saída, nesse caso, 137s, adicione -t 137
como uma opção de saída, removendo os sinalizadores mais curtos.
ffmpeg -loop 1 -i image.jpg -i watermark.png -ss 00:08:02.00 -t 137 -i input.mp3 -filter_complex scale=nhd,overlay=W-w-5:H-h-5 -r 1 -c:v libx264 -c:a aac -t 137 output.mp4