Codec de áudio ótimo e formato / opção correspondente para a gravação de voz em salas de aula pequenas e grandes

2

O OneNote da Microsoft fornecido com o Office2010 funciona muito bem para o software de anotações. Inclui a função para gravar áudio / vídeo ou apenas áudio. As opções do programa para o Codec são: a) Windows media audio 9, b) Windows Media Audio 9.2 e c) Windows Media Audio 10 Professional. Especialmente no caso do último Codec, muitos formatos estão disponíveis, de < 0kbps, 8kHz, mono CBR & gt ;, a < 320 kbps, 44kHz, estéreo (A / V > CBR > Eles parecem ser divididos em duas categorias: (A / V) e não-A / V (o que quer que isso signifique, eu não sei), e então de acordo com o kHz deles, e depois de kbps. , mono e o que é chamado de "atraso baixo CBR".

Com uma compreensão básica destes termos, pode-se adivinhar que 320kbps 48kHz CBR é um exagero para essa filosofia de uso, e 0kbps 9kHz, mono CBR deixa algo a desejar em qualidade, especialmente com discos rígidos de 1 TB nesses dias . No entanto, responder à questão de qual formato seria mais adequado a essa filosofia de uso é outra questão que pode exigir um nível de conhecimento diferente do que a maioria das pessoas teria. Pode-se adotar a abordagem try-it-and-see, mas essa questão parece adequada ao superusuário para deixar passar a oportunidade de postar.

Então, minha pergunta é: Qual combinação de Codec / Formato seria mais adequada para a filosofia de uso de gravação de áudio para anotações, em um auditório grande ou pequeno. Isso pode ser duas perguntas; Um certo codec seria desejável em certas salas de tamanho?

p.s. subquestion: O que, no codec profissional windows audio 10, o formato (A / V) designa?

    
por jhstuckey 07.02.2012 / 00:10

1 resposta

2
  • Taxa de bits é quão bem o áudio pode ser aproximado por uma determinada quantidade de dados. Taxas de bits muito baixas introduzem voz distorcida, artefatos estranhos e não naturais, suavizando transientes (sons curtos como a letra T). Taxas de bits mais altas corresponderão ao conteúdo original mais de perto, mas potencialmente inúteis se os benefícios não forem claramente audíveis (exagero). A taxa de bits variável sempre fornecerá melhor qualidade que o CBR de taxa de bits constante com a mesma taxa de bits, desde o codificador, do que concentrando mais esforço (dados) nas partes mais difíceis de codificar.

Vamos chamar a taxa de bits: Integridade de áudio .

  • Taxa de amostragem afeta o possível espectro de freqüência que um arquivo de áudio pode ter. O valor típico é de 44 khz, uma vez que cobre praticamente toda a faixa audível (0-22kHz). Ao reduzir a taxa de amostragem, você está perdendo freqüências mais altas que não serão mais codificadas, facilitando a codificação do que resta com melhor integridade. No entanto, a redução das taxas de amostragem pode alterar o ruído de fundo que está presente na maioria das gravações, e isso pode fornecer efeitos colaterais indesejáveis (ruído mais agudo) e, eventualmente, sibilance questões (" s "sons) ou sem vida simples - mesmo com taxas de bits muito altas. Diminuir a taxa de amostragem pode ser um trade-off muito eficaz quando se trabalha com taxas de bits muito baixas; Os protocolos de telefonia de voz sobre IP são uma excelente demonstração disso.

Vamos chamar a taxa de amostragem riqueza de áudio .

  • Estéreo: se o seu som é principalmente mono, como a fala, você está gastando metade da largura de banda codificando-o como estéreo (a menos que seja estéreo conjunto, mas isso é outra história).

Com música, eu acho que é de conhecimento geral que o som estéreo de 44kHz com 128kbps e MP3 é o ponto de inflexão onde alguma degradação da música é perceptível para quase qualquer um, enquanto ainda pode ser ouvida. Como a fala é mais fácil de codificar do que a música, eu acho que seu equivalente mono-MP3 64kbps 44.1khz- fornece um excelente ponto de partida com ampla qualidade para a maioria dos propósitos, embora não seja um exagero.

Por fim, o Windows Media Audio pretende ser muito mais eficiente que o MP3. Assim, você pode facilmente compensar esses pontos de referência em 25-40% (por exemplo, WMA 40kbps deve ser semelhante ao MP3 64kbps). O WMA Professionnal deve ser melhor que o WMA 9, aparentemente reduzindo o número de opções de codificação de baixa taxa de bits que o WMA9 tem e use automaticamente o melhor método para a maioria dos conteúdos. Então, a menos que você precise reproduzi-lo em dispositivos que suportem apenas o WMA9, provavelmente é a melhor opção.

Espero que você possa progredir (ou diminuir) a partir daí.

    
por 07.02.2012 / 04:11