Você pode medir objetivamente a diferença de qualidade entre duas partes de áudio?

2

Existe uma maneira de medir objetivamente a diferença de qualidade entre dois arquivos de áudio - por meio de uma medida "científica", e não usando os ouvidos ou a opinião de alguém?

Eu tenho dois arquivos - um codificado a 768kb / seo outro a 1536kb / s. Eu estou querendo saber se há uma maneira de determinar quanto mais alta qualidade é uma sobre a outra. Talvez seja possível abri-los em um tipo de programa de análise de áudio e verificar se há recorte, resolução, etc.?

    
por Coldblackice 31.03.2013 / 20:19

4 respostas

9

Você pode dizer objetivamente a qualidade?

Geralmente, não, não há maneira exata de medir objetivamente a qualidade de áudio com precisão suficiente. Simplesmente dito: Sem pedir a um grupo de pessoas para a sua classificação específica, você nunca pode quantificar "quanto mais alto" na qualidade de um pedaço de áudio, comparado a outro. Qualidade em si nunca é absoluta - é altamente subjetiva.

O que os pesquisadores geralmente fazem para aliviar esse problema é o seguinte: eles definem uma escala de acordo com a qual eles permitem que um conjunto de pessoas classifique a qualidade, como um ponto cinco ( Bad , Ruim , Justo , Bom , Excelente ). Ou você poderia simplesmente comparar certos codecs (mas isso não lhe daria dados muito significativos). Os pesquisadores, então, usam essas classificações para modelar uma métrica de computador que tenta prever a resposta humana.

Métricas objetivas de qualidade

Uma métrica objetiva de qualidade de áudio bastante antiga, mas popular, é Avaliação perceptivo da qualidade do áudio (PEAQ) , descrita em ITU-R BS.1387 (1998). Basicamente, ele tenta emular o ouvido humano e gerar pontuações de opinião de 1 a 5, como um ouvinte humano faria. O PEMO-Q de 2006 é uma métrica mais recente que afirma ter superado o PEAQ.

Estas métricas são frequentemente testadas em sons únicos ou fala, e não necessariamente em música, já que é muito mais difícil estimar a qualidade percebida a partir de sons complexos, onde os efeitos de mascaramento são muito mais prevalentes. Esta métrica de 2008 é mais direcionada para música.

Parece-me que a pesquisa em métricas de qualidade de áudio não é tão ativa quanto as métricas de qualidade de vídeo (um tópico em que estou trabalhando). Você terá dificuldade em encontrar uma ferramenta autônoma que possa ser usada no Windows, onde você pode simplesmente conectar duas fontes de áudio e obter um resultado. A maioria das métricas é desenvolvida internamente em institutos de pesquisa e raramente vê a luz do público. Ou eles são ferramentas comerciais para emissoras e provedores de telecomunicações.

Aqui está uma implementação do PEAQ pelo MATLAB , mas é tudo que eu sei do topo da minha cabeça.

O que você pode fazer ao comparar arquivos

Olhando para o problema do ponto de vista técnico, é importante mencionar que você pode - em teoria - adivinhar qual arquivo oferece a melhor qualidade apenas observando a taxa de dados. Isso, no entanto, só funciona de forma confiável quando os arquivos contêm o mesmo conteúdo de origem e foram codificados com o mesmo codificador.

Essa é a ideia por trás dos testes de escuta de codecs: você pega a mesma fonte, codifica-a para diferentes taxas de dados (ou níveis de qualidade) com diferentes codificadores e faz com que os usuários os comparem. Com esses dados de "verdade fundamental", você poderia, por exemplo, dizer que um arquivo MP3 codificado com LAME a 128 kBit / s soa igualmente bom como um arquivo AAC codificado com FAAC a 64 kBit / s (são números compostos, mas você a ideia).

É ainda mais fácil se você souber que o mesmo codificador foi usado para os dois arquivos, porque as chances são muito altas de que a taxa de dados (tamanho do arquivo) seja suficiente para fazer uma suposição sobre a qualidade resultante.

Mas, novamente, isso só funciona quando as fontes são as mesmas. Alguns codecs apresentam melhor desempenho para diferentes tipos de música ou fala. Alguns funcionam melhor com taxas de bits mais baixas e não fornecem necessariamente melhor qualidade a taxas mais altas. Existem muitos fatores a serem considerados.

    
por 31.03.2013 / 20:46
1

As melhores medidas são formato e taxa de amostragem. Embora o tamanho do arquivo possa lhe dar uma ideia.

Na verdade, precisamos reconhecer que a diferença na qualidade da gravação pode não significar que soará melhor para o ouvido, será simplesmente uma melhor fidelidade à gravação original.

Formato - O MP3 não terá a mesma qualidade de um formato sem perdas como o FLAC e, dependendo de outros fatores no codec, dois formatos com perdas podem ter resultados diferentes baseados na compactação e como a compactação é feita

A taxa de amostragem vai determinar com que frequência as informações são tiradas da gravação e depois reproduzidas por segundo, obviamente, 1Hz seria de qualidade horrível, onde 24kHz soaria bem. Maior é melhor.

Bit Depth É semelhante a um processador, onde para cada amostra você pode gravar x bits por amostra. Mais bits significa mais informação, o que significa uma gravação de melhor qualidade.

Tamanho do arquivo É o resultado da qualidade da gravação. Onde Sample Rate, Bit Depth, Channels e compressão são os ingredientes para o tamanho do arquivo. Você pode calcular os exemplos para ver.

Meu aviso aqui é que isso pode não importar em algumas gravações. Se você está ouvindo uma gravação dos anos 40, vai ser uma gravação ruim, não importa o quê. Você não pode adicionar informações que o formato original não continha a uma nova gravação, aumentando qualquer uma das opções acima.

    
por 31.03.2013 / 20:45
0

Você pode abri-los em um programa de edição de áudio e reduzir as ondas individuais (digitais) e comparar os pixels com um original.

Aousaresteprograma,muitasvezesvejoaescadariaeorecortecomfacilidade,quegeralmenteédeumataxamuitobaixaoudequalidademuitobaixadecodificações,ouambos.

Paraseaprofundarquandovocêfalataxasmuitoaltas,teriaquecompararumapartedelevisualmente. Tendosonsquedeveriamsersemelhantes,existemmétodosdediferenciação,pararemoverumclipedesomcomoutroclipedesom,oquerestasãoasalteraçõesentreeles. Ali,umdosfiltrosderuídopoderiafazerissofacilmente,háoutrosmétodosquetenhocerteza,comomixagemnegativa,emqueumcloneperfeitodosomzerariaalinhavisual.

Achoqueinvertera"fase" e fazer uma mistura aditiva também faz isso. O resultado final de um clone reverso perfeito misturado com o original deve ser uma linha totalmente plana e sem saída de som quando reproduzido.  É bastante fácil testar a teoria e elaborar um plano, usar o mesmo clipe de som primeiro, depois tentar a mesma coisa com o clipe compactado.

Pense nisso assim, em um programa de fotos que você pode carregar em uma versão compactada em Jpeg da mesma imagem em que está trabalhando, faça uma sobreposição de diferenciação. Alinhe o clipe ao original, e todos os artefatos e blocos e mudanças de cor aparecem instantaneamente como cores e níveis de cores, tudo o que é 100% o mesmo que o original é preto puro. Com um editor de áudio, você pode fazer o mesmo para o áudio.

    
por 01.04.2013 / 11:49
-1

Se você não tiver um original sem perdas de qualquer forma, poderá comparar a qualidade de duas músicas com perda de código por parte de seus ouvidos.

    
por 01.04.2013 / 12:07