O que um fabricante de respeitados equipamentos de áudio pensa sobre o assunto.
Publicado por: PS Audio
https://www.psaudio.com/copper/article/audio-myths/
Estou envolvido com tecnologia de áudio desde os anos 60, e ainda estou surpreso – e um pouco desanimado – de ver os mesmos mitos repetidos por tantas vezes. Como a “conexão” funciona isso é totalmente compreendido, mas continuo a ver afirmações fantásticas que desafiam a ciência básica do áudio. Na verdade, muito do que leio online e na grande mídia impressa está simplesmente errado. Por exemplo, a noção de que equipamento de áudio pode medir bem, mas soar ruim é uma crença comum que é fácil de refutar. Claro, isso pressupõe que as coisas certas sejam medidas.
Da mesma forma, a menos que você acredite que o matemático pioneiro Joseph Fourier estava errado, a música é, na verdade, composta inteiramente de ondas senoidais, então medir equipamentos de áudio usando ondas senoidais é perfeitamente aceitável. Mas, novamente, as coisas certas devem ser medidas. Por exemplo, você não pode apenas medir a distorção de um amplificador de potência com saída de 1 watt a 1 KHz, como é comum. A distorção geralmente aumenta em frequências mais baixas, especialmente com amplificadores valvulados que usam transformadores. Ela também pode aumentar em níveis de potência mais altos ou mais baixos, dependendo da natureza da distorção.
Na verdade, existem inúmeras maneiras pelas quais as pessoas podem ser enganadas, seja propositalmente por vendedores de equipamentos ou por jornalistas de áudio bem-intencionados, mas mal informados.
Outro lugar onde vejo especificações mal utilizadas ou simplesmente ausentes são os produtos de isolamento de caixas acústicas. Se você quiser saber como (ou mesmo se) o som melhorou depois de colocar uma caixa acústica sobre uma base de isolamento, você precisa medir o som na sala usando um software desenvolvido para essa finalidade. Mostrar que uma almofada de neoprene bloqueia a vibração não faz sentido se um gabinete de caixa acústica não vibrar o suficiente para criar qualquer som em primeiro lugar. Na verdade, existem inúmeras maneiras pelas quais as pessoas podem ser enganadas, seja propositalmente por vendedores de equipamentos ou por jornalistas de áudio bem-intencionados, mas mal informados.
Dois mitos comuns que foram amplamente desmascarados, mas ainda são frequentemente repetidos, referem-se à necessidade de taxas de amostragem maiores do que o padrão de CD 44,1 KHz. Tsutomu Oohashi et al relatou em 2000 os resultados de experimentos que alegaram que tiveram provas de que as pessoas podem perceber o conteúdo ultrassônico, confirmando, assim, para audiófilos e vendedores de produtos de “alta definição”, que a qualidade do áudio do CD é inadequada. Infelizmente, eles cometeram um erro fatal: eles usaram somente um transdutor acústico para reproduzir várias frequências ultrassônicas ao mesmo tempo, então a distorção por intermodulação nos tweeters criou diferenças de frequências na faixa audível. Quando o experimento Oohashi foi repetido um ano depois por Shogo Kiryu e Kaoru Ashihara usando seis transdutores separados [1], nenhum dos sujeitos dos testes foi capaz de distinguir o conteúdo ultrassônico. De seu resumo:
“Quando o estímulo foi dividido em seis bandas de frequências e apresentado em seis alto-falantes para reduzir as distorções de intermodulação, nenhum sujeito conseguiu detectar ultrassom. Concluiu-se que a adição de ultrassons pode afetar a impressão sonora por meio de alguma interação não linear que pode ocorrer nos alto-falantes.”
Os engenheiros de áudio têm investigado o ultrassom por décadas, mas nenhum teste legítimo jamais descobriu que as pessoas podem ouvir ou perceber frequências superiores a cerca de 20 KHz. Outro pesquisador, Milind Kunchur, achou que encontrou uma maneira diferente de provar que altas taxas de amostragem são necessárias: resolução temporal. Ele afirmou que os ouvidos podem detectar diferenças de tempo de chegada tão pequenas quanto 5-10 microssegundos, o que é verdade, mas concluiu erroneamente que reproduzir esses pequenos deslocamentos de tempo requer uma taxa de amostragem superior a 44,1 KHz. O que o Dr. Kunchur não considerou é que a profundidade de bits também afeta a resolução de tempo, e 44,1 KHz a 16 bits é de fato perfeitamente adequado para resolver o tempo tão bem quanto qualquer um pode ouvir. Isso é elegantemente comprovado em um vídeo de Monty Montgomery da Xiph.org. O link abaixo leva diretamente para essa parte do vídeo, embora eu incentive as pessoas a assistirem o vídeo inteiro porque ele desmascara vários outros mitos comuns sobre o áudio digital:
Sou engenheiro de áudio profissional e músico há quase 50 anos. Já ouvi chiado de fitas analógicas e cassetes muitas vezes. Já ouvi barulho de superfície e estalos em discos de vinil. Mas nunca notei ruído de fundo de um CD.
Outra crença incorreta é que a faixa dinâmica de 96 dB de 16 bits é inadequada. Sou engenheiro de áudio profissional e músico há quase 50 anos. Já ouvi chiado de fitas analógicas e cassetes muitas vezes. Já ouvi barulho de superfície e estalos em discos de vinil. Mas nunca notei ruído de fundo de um CD. Se você analisar as gravações com um software editor de áudio, verá que o ruído ambiente da sala geralmente é o fator dominante. Às vezes, o ruído do circuito dos microfones ou pré-amplificadores é mais alto, mas o ruído da fonte é sempre maior do que o piso de ruído de -96 dB dos CDs. Com a maioria das gravações, se você reproduzir uma passagem silenciosa, o medidor de VU lê em torno de -70 a -80 na melhor das hipóteses, o que é igual a 11-13 bits. Portanto, simplesmente não há benefício audível em 24 bits. A única coisa que a profundidade de bits afeta é o nível de ruído. Não afeta a resolução, clareza, imagem ou qualquer outra coisa – apenas ruído residual.
Como você pode imaginar, algumas empresas têm interesse financeiro em provar que os CDs são inadequados. Mas, quando testado corretamente, ninguém jamais demonstrou identificar com segurança a diferença entre a qualidade de áudio de CD e taxas de amostragem ou profundidades de bits mais altas. Novamente, isso vem sendo pesquisado há muitos anos, sempre com a mesma conclusão. Como nós, céticos, dizemos, “Afirmações extraordinárias exigem provas extraordinárias” e até agora não houve tal prova.
Então, o que afeta a fidelidade do áudio? Como podemos saber se um dispositivo colocado à venda realmente vale a pena ou é apenas óleo de cobra (snake oil) e falsas promessas? Vi nos comentários de outro artigo da Copper Magazine alguém pedir uma lista do “que importa” no áudio. Posso dizer que apenas quatro parâmetros são necessários para definir tudo o que afeta a fidelidade de áudio: ruído, resposta de frequência, distorção e erros baseados em tempo. Mas, também existem subconjuntos desses parâmetros.
O ruído é o chiado de fundo da fita analógica ou dos circuitos eletrônicos. Um primo próximo é a faixa dinâmica, que define a amplitude (expressa em decibéis) entre o ruído de fundo e o nível mais alto possível antes do início da distorção mais grosseira. CDs e DVDs têm uma faixa dinâmica muito grande, portanto, qualquer ruído que você ouvir é da fita analógica original, foi adicionado como um subproduto durante a produção ou estava presente na sala e captado pelos microfones quando a gravação foi feita. Os subconjuntos de ruído são pulsações e zumbidos da CA, crepitações eletrônicas, cliques e estalos em discos de vinil, interações cruzadas entre canais e até janelas que vibram e zumbem em níveis de volume altos.
A resposta de frequência é o quão uniformemente um dispositivo de áudio passa por uma faixa de frequências. Os erros são ouvidos como muito ou pouco graves, médios ou agudos. Para a maioria das pessoas, a faixa audível se estende de cerca de 20 Hz na extremidade inferior, a apenas 20 KHz. Os subconjuntos de resposta de frequência são microfonias físicas, realimentações, oscilação eletrônicas e realimentação acústica. Esses subconjuntos são menos necessários para que os consumidores entendam, mas são importantes para engenheiros de projeto e de acústica.
Em alguns contextos, uma quantidade modesta de distorção pode soar agradável, e é por isso que o vinil e os aparelhos eletrônicos valvulados ainda são populares. Claro, a distorção é tolerável e até desejável em amplificadores de guitarra, mas isso é criação de música, e não reprodução de alta fidelidade.
Distorção é a palavra comum para o termo mais técnico “não linearidade” e adiciona novos componentes de frequência que não estavam presentes na fonte original. Quando a música passa por um dispositivo que adiciona distorção, novas frequências são criadas e podem ou não ser agradáveis ??ao ouvido. O objetivo do projeto para equipamentos de áudio de alta fidelidade é que toda a distorção tenha um nível tão baixo que não seja ouvida. No entanto, em alguns contextos, uma quantidade modesta de distorção pode soar agradável, e é por isso que o vinil e os aparelhos eletrônicos valvulados ainda são populares. Claro, a distorção é tolerável e até desejável em amplificadores de guitarra, mas isso é criação de música, e não reprodução de alta fidelidade.
Existem dois tipos básicos de distorção – harmônica e por intermodulação – e ambos geralmente estão presentes conjuntamente. A distorção harmônica adiciona novas frequências que estão musicalmente relacionadas à fonte. Em termos leigos, a distorção harmônica adiciona uma característica ligeiramente densa ou ruidosa à música. Todos os instrumentos musicais criam tons com harmônicos, de modo que a distorção harmônica em um amplificador de potência apenas altera o caráter do instrumento em intensidade.
A distorção por intermodulação (IM) requer que duas ou mais frequências estejam presentes e é muito mais prejudicial porque cria um novo conteúdo que não está relacionado musicalmente ao original. Mesmo uma pequena distorção por IM adiciona uma qualidade dissonante que pode ser desagradável de ouvir. Outro tipo de distorção é chamada de aliasing e é exclusiva do áudio digital. Como a distorção por intermodulação, o aliasing cria novas frequências não harmonicamente relacionadas ao original e, portanto, é desagradável e irritante de ouvir. Felizmente, na maioria dos dispositivos de áudio modernos, todas as distorções são suaves demais para serem ouvidas.
O áudio digital tem um tipo único de desvio de tempo chamado jitter, mas com todas as placas de som modernas, o jitter é muito menos intenso do que a música, e você nunca vai ouví-lo.
Os erros baseados no tempo afetam principalmente o tom e o andamento. Quando o furo central de um LP (vinil) não está bem centrado, você ouvirá o tom aumentar e diminuir a cada revolução. Isso se chama wow. Os gravadores analógicos têm um tipo diferente de instabilidade de pitch, chamado flutter. Ao contrário da mudança lenta de tom de wow, a vibração é mais rápida, dando um efeito de gorjeio. O áudio digital tem um tipo único de desvio de tempo chamado jitter, mas com todas as placas de som modernas, o jitter é muito menos intenso do que a música, e você nunca vai ouví-lo.
A acústica da sala pode ser considerada um quinto parâmetro de áudio, mas na realidade não é. As paredes da sala próximas podem criar erros de resposta de frequência devido às reflexões das ondas combinadas no ar. As reflexões também podem criar ecos audíveis e reverberação, mas esses são fenômenos baseados no tempo que ocorrem fora do equipamento, portanto, também não garantem sua própria categoria. Da mesma forma, com amplificadores de potência, a potência máxima de saída é importante. Mas isso não está relacionado à fidelidade – apenas define o quão alto o amplificador pode tocar.
Os parâmetros acima abrangem tudo que afeta a fidelidade de áudio. Se um dispositivo tem ruído e distorção muito baixos de ouvir, uma resposta suficiente para acomodar uniformemente toda a gama de frequências audíveis e erros baseados no tempo muito pequenos para serem percebidos, então esse dispositivo será transparente para a música e outros sons que passam por ele . No entanto, a clareza e a imagem estéreo são muito afetadas pela acústica da sala. Sem dúvida, a sala de audição tem muito mais efeito na qualidade do som do que qualquer um dos componentes de áudio.
Um mito final que irei abordar é a noção de que existem aspectos do áudio que a “ciência” não conhece, ou pode ignorar durante a medição. Isso também é fácil de refutar usando o teste nulo (null test). Um teste nulo compara quaisquer duas fontes de áudio e as combina em volume igual com a polaridade de uma fonte invertida. Assim, à medida que uma onda se torna positiva, a outra é negativa (oposta), cancelando-se completamente. Depois de anular as duas fontes, qualquer sinal residual que permaneça revela sua diferença, e isso inclui artefatos que você pode nem pensar em achar. O teste nulo, ou de cancelamento, tem sido usado para medir dispositivos de áudio desde os anos 1940. Se realmente houvesse algum aspecto do áudio que fosse desconhecido, ele teria aparecido há muito tempo em um resíduo nulo.
[1] http://www.aes.org/e-lib/browse.cfm?elib=10005
Seja o primeiro a comentar