Pergunta 1 - O comando está incompleto porque você não leva em conta a faixa audio , você alterou o PTS somente no vídeo faixa. Para ver a diferença, tente isto:
# no-good, starts from 4th second audio with a frozen video frame
ffmpeg -i in.mp4 -vf trim=5:7 out.mp4
#
# works as expected, both audio and video start at 5th second
ffmpeg -i in.mp4 -vf trim=5:7 -af atrim=5:7 out.mp4
Pergunta 2 - Isso também não funcionará como esperado pelo mesmo motivo, mas uma vez que você conserte a edição anterior, aqui está um truque não muito elegante, mas eficaz, para correlacionar o "antes" e "depois":
# overlay the input video with a timer, pulled to the right 200 pixels
ffmpeg -i in.mp4 -f lavfi -i testsrc=n=3 -vf overlay=x=200 in-with-time.mp4
#
# do all your manipulation, and finaly overlay with another timer at x=0
ffmpeg -i in-with-time.mp4 -f lavfi -i testsrc=n=3 -filter_complex "..stuff...,overlay[out]" out.mp4
Isso fornece a você por quadro o tempo original e resultante com precisão de 1 milissegundo.