Existem dois algoritmos estabelecidos que podem medir a fidelidade do vídeo à sua origem. Você tem que inserir dois fluxos de vídeo, a fonte original e a versão codificada, e o algoritmo calcula a fidelidade e gera uma figura.
Infelizmente para você, ambos exigem que você forneça a fonte não compactada junto com o vídeo compactado, para fazer uma comparação. Não há algoritmo confiável para detectar a qualidade do vídeo que não requer a fonte.
-
PSNR é uma medida muito simples que apenas faz a diferença em cada pixel entre a fonte e a versão codificada e calcula a média dos quadrados dessa diferença em todos os pixels em todos os quadros igualmente, chegando a uma figura , que pode ser expresso como "relação sinal-ruído".
À medida que os codecs de vídeo se tornavam cada vez mais sintonizados psico-visualmente, esse algoritmo se tornava cada vez mais irrelevante. Hoje, otimizar um codec de vídeo para PSNR equivale a otimizá-lo para parecer mal . É uma medida muito ruim de como a fidelidade ao vídeo de origem realmente parece aos olhos humanos.
-
SSIM foi criado em grande parte devido a essas deficiências no PSNR. É um algoritmo mais complexo que também leva em conta quão bem a forma de estruturas na imagem resultante corresponde a estruturas na fonte. Isso pesa strongmente contra certos artefatos comuns na compactação baseada em blocos anteriores (por exemplo, MPEG-2 como usado em DVD) que inclui bloqueio ou toque, artefatos que contribuem muito para nossa percepção da qualidade do vídeo, embora sua contribuição para o PSNR seja menor. / p>
O SSIM chega a um número indicando similaridade, que pode ser convertido em uma proporção semelhante ao PSNR.
À medida que os codecs de vídeo evoluíram ainda mais, o SSIM agora também tem limitações, tornando-o similarmente inadequado como uma medida abrangente da fidelidade do vídeo. Os codecs de vídeo modernos, como o h.264, não têm muito problema com estruturas de bloqueio devido a recursos como desbloqueio em loop e transformações 4x4, enquanto ainda sofrem perda de detalhes e ruído (desfoque), o que não é bem medido pelo SSIM.
Existem outros algoritmos, alguns dos quais pretendem resolver as deficiências desses algoritmos, mas nenhum deles ganhou tanta popularidade.
Portanto, nenhum desses algoritmos é uma maneira adequada de medir a qualidade do vídeo perceptivo. Em vez disso, a sintonização de codecs de vídeo requer muita observação: de preferência, comparações duplo-cegas para que o observador não possa ser influenciado por conhecer o codec em uso: um feito difícil para codecs de vídeo que deixam sinais indicadores exclusivos do codec codec mesmo em vídeos compactados de taxa de bits razoavelmente alta.