Qual é o máximo de taxa de bits de áudio que os humanos podem distinguir? [fechadas]

3

Algumas taxas de bits de áudio chegam a 256kbps. Mas eu escuto músicas muito claras com 92kbps. Eu fiquei desconfiado de que, além de uma certa taxa de bits de x kbps, o ouvido humano médio não pode dizer a diferença. O que é x?

Embora a questão não seja específica do Ubuntu, ela surgiu por causa de uma questão de formato aberto ogg que eu dividi.

Vantagens do mp3 para ogg

    
por Strapakowsky 31.08.2011 / 10:46

2 respostas

6

Taxa de bits per se não é distinguível porque não é uma medida da informação de áudio que ouvimos. É o tamanho da informação após o codificador remove o que considera inaudível (e, portanto, "descartável" com perda mínima ou nenhuma).

Os bons codificadores têm bons algoritmos psicoacústicos, o que significa que eles escolhem sabiamente como remover frequências altas e freqüências cuja amplitude é pequena demais para serem percebidas, e então empacota a onda "cortada" na taxa de bits dada. Quanto mais alta a taxa de bits, menos um codificador deve cortar do áudio original, mas quão distinguíveis são as partes removidas têm mais a ver com as decisões tomadas pelo algoritmo (seu modelo psicoacústico) do que com a taxa de bits real. Encoders pobres (como o Xing antigo) precisarão de uma taxa de bits maior do que uma boa (como um coxo moderno) para alcançar o mesmo nível de qualidade percebida. Porque, dados os mesmos bits, ele escolheu o que para codificar e o que descartar.

Então, não pense em taxas de bits de MP3 da mesma forma que você pensa em uma taxa de bits de CD. Em um CD, a onda sonora analógica é codificada apenas digitalmente, nada é removido. Então, quanto mais bits, mais precisa será sua onda sonora. Assim, você pode ter um mapeamento 1-1 da taxa de bits para a precisão percebida. Isso é não possível com codificação MP3 (ou OGG), ou qualquer codificação com perdas que se baseie em modelos psicoacústicos

Além disso, "distinguível" é subjetivo: a audição humana e a sensibilidade de alta frequência deterioram com a idade ... então você pode desfrutar de 96kpbs agora, mas 10 (ou 20) anos atrás você certamente " preciso de mais. Diferentes pessoas distinguem as altas frequências (ou pequenas amplitudes) de forma diferente .. então, para elas , um determinado codificador pode ser melhor que outro, mesmo com uma taxa de bits menor. Além disso, o equipamento e o ambiente têm um papel fundamental: ouvir música em um carro na estrada não é o mesmo que em uma sala silenciosa com fones de ouvido de alta qualidade.

Existem outros fatores também ... especialmente VBR ... o que significa que a taxa de bits muda constantemente ... indo até 320 para partes da música que requerem codificação mais complexa, e indo para 96 onde nada precisa ser removido. Portanto, um arquivo VBR com uma média de 128kpbs geralmente terá uma qualidade muito superior a uma taxa de bits constante (CBR) de 160 (ou 192).

Dito isto, um VBR de 128kpbs é perfeito para mim , mesmo usando fones de ouvido de boa qualidade. Para o CBR, 192 é suficiente para a transparência (o que significa que não consigo distinguir do cd-audio original e sem perdas). Eu sou 33, e não um audiófilo, assim sua milhagem pode variar.

Uma analogia:

Uma boa analogia chegou até mim agora ... pode ajudar a entender por que é impossível responder à pergunta "acima de x kbps que o ouvido humano não consegue distinguir":

Pense no áudio como uma casa e seus móveis. Você está se mudando para outra casa. Seu caminhão em movimento é sua taxa de bits: quanto maior, mais mobília você poderá levar para sua nova casa. Mas como é uma viagem só de ida e o caminhão não é grande o suficiente para conter tudo, algo sempre será deixado para trás e, portanto, perdido .

Você será capaz de distinguir que algo foi perdido? Você concorda que depende tanto (ou mais) do que foi escolhido para ser deixado para trás do que quão grande o caminhão era, mesmo que um caminhão maior realmente ajudará?

Você concorda que é impossível medir o tamanho do caminhão para que ele seja "indistinguível", a menos que o caminhão seja grande o suficiente para acomodar todos os seus móveis? (Isso será lossless codificação, como FLAC. E isso é cerca de 5 vezes maior que o maior MP3).

Palavras finais:

Alguns podem dizer que a medição objetiva em limiares auditivos humanos é possível. É verdade que você pode medir o ouvido humano por quão alta a frequência é inaudível, ou quantos dB um determinado som pode estar abaixo do "dominante", pois é indistinguível. Mas você pode não traduzi-lo diretamente em bitrates, porque quantos bits são necessários para codificar (ou descartar) isso depende de quanto dele está presente em uma determinada música.

    
por MestreLion 31.08.2011 / 11:17
1

O fórum da Hydrogenaudio fez vários testes ABX sobre esta questão. A maioria das pessoas não consegue consistentemente dizer a diferença entre material fonte não comprimido e arquivos compactados na faixa VBR de ~ 160kbps, mas algumas músicas são realmente difíceis de compactar com precisão, e algumas pessoas são adeptas de ouvir a diferença com codificações com perdas a 320kbps para determinadas músicas . A resposta é: depende.

Você quer dizer que 192 kbps é muito, muito claro? 92kbps é uma taxa de bits um pouco baixa, e eu posso facilmente dizer a diferença. A menos que você esteja ouvindo em um ambiente barulhento onde a qualidade não importa tanto (como ouvir um dispositivo portátil no barramento), eu evitaria que alguma vez fosse abaixo de ~ 128kbps VBR com música estéreo. Você está sacrificando a qualidade para economizar um pouco de espaço, e o trade-off não vale a pena na minha opinião.

Você pode descer para algumas taxas de bits muito baixas (abaixo de 80kbps, por exemplo) e manter uma qualidade aceitável para a música e a fala mono .

    
por Chris Granger 31.08.2011 / 11:13