Dependendo da matéria-prima, esse clique provavelmente será um artefato de como os dados de imagem e áudio são combinados (muxed) nos diferentes formatos. A causa fundamental subjacente é que, embora haja uma imagem em diferentes pontos bem definidos no tempo (ou seja, 25 vezes por segundo), o fluxo de áudio é contínuo. Se o fluxo de áudio dentro do arquivo agora não iniciar exatamente em um momento, quando a primeira imagem for exibida, artefatos aparecerão.
A maneira mais fácil de corrigir isso é processar áudio e vídeo separadamente - assim como o software de edição profissional. Minha recomendação é usar a ferramenta de linha de comando ffmpeg
, que é algo como o canivete suíço de processamento de AV (e, em seguida, alguns).
Se você quiser extrair uma parte de um vídeo, use
ffmpeg -ss [start time in seconds] -i [input file] -map '0:a' -vn -c copy -t [run time in seconds] [audio file.mka]
ffmpeg -ss [start time in seconds] -i [input file] -map '0:v' -an -c copy -t [run time in seconds] [video file.mkv]
ffmpeg -i [video file.mkv] -i [audio file.mka] -map '0:v' -map '1:a' -c copy [output file]
A primeira linha extrai o segmento de áudio, o segundo o segmento de vídeo. A última linha irá combinar ("multiplex" ou "mux") esses dois arquivos em um único arquivo de resultado.