Se tiver certeza de que é apenas essa parte do áudio, você pode simplesmente ignorá-lo:
ffmpeg -i input.mp4 -af volume=0:enable='between(t,01:21:47,01:22:24)' -c:v copy output.mp4
Dependendo do seu shell, você pode ter que escapar dos dois pontos nos timecodes, ou talvez mudar para a representação de segundos (01:21:47 = 4907, 01:22:24 = 4944).