AUDIO DIGITAL
O som é uma vibração do ar, isto é, uma sequência de sobre pressões e depressões do ar em relação a uma média, que é a pressão atmosférica.
A maneira mais simples de reproduzir um som actualmente é fazer vibrar um objecto. Desta maneira, um violino emite um som quando o arco faz vibrar as suas cordas, um piano emite uma nota quando se bate uma tecla porque um martelo vai bater numa corda e fazê-la vibrar.
Para reproduzir sons, utilizam-se geralmente alto-falantes. Trata-se, com efeito, de uma membrana ligada a um electroíman que, de acordo com as solicitações de uma corrente eléctrica vai avançar e recuar muito rapidamente, o que provoca uma vibração do ar situado à frente dele.
Frequências de amostragem
Em áudio digital, a forma de onda de som é dividida em amostras individuais, geralmente espaçadas no tempo, constituindo uma aproximação à forma de onda original. Este processo chama-se conversão analógico-digital, ou também de amostragem.
Por taxa de amostragem ou frequência de amostragem entende-se o número de amostras retiradas da forma de onda original, por segundo. Quanto maior for a taxa de amostragem, melhor será a aproximação à onda original.
A taxa de amostragem limita a gama de frequências que o sinal a amostrar pode conter, sendo que o limite máximo para essa gama é metade do valor da taxa de amostragem. Este valor provém de um teorema muito conhecido no mundo do áudio: o Teorema de Nyquist.
Para poder representar um som num computador, é necessário conseguir convertê-lo em valores numéricos, porque este só sabe trabalhar com este tipo de valores. Trata-se, por conseguinte, de aumentar pequenas amostras de som (o que corresponde a aumentar as diferenças de pressão) em intervalos de tempos precisos.
Dado que para restituir um som que parece contínuo para os nossos ouvidos são necessárias amostras de cada 100 000i de segundo, é mais prático raciocinar sobre o número de amostras por segundo, exprimidas em Hertz (Hz). Eis alguns exemplos de taxas de amostragem e qualidades dos sons associados :
Taxa de amostragem Qualidade do som
44 100 Hzqualidade CD
22 000 Hzqualidade rádio
8 000 Hzqualidade telefone
Portanto, para um sinal com frequências até 8000 Hertz, é necessário que a taxa de amostragem seja maior ou igual a 16000 Hertz. Por exemplo, nos sistemas baseados em Compact Disc Audio (CD), a taxa de amostragem é de 44100 Hertz (44100 amostras por segundo), visto que a frequência máxima que um ouvido humano pode captar é de cerca de 20000 Hertz.
Bits por amostra
O som é representado então por uma sequência de amostras, regularmente espaçadas no tempo. Essas amostras são representadas numericamente, em formato digital. Este formato consiste num código, chamado código binário, em que os números são representados sob a forma de uma sequência de bits. Um bit pode apenas apresentar o valor ‘0’ ou o valor ‘1’, retratando dois estados possíveis: ligado (‘on’) ou desligado (‘off’). Portanto, se usarmos apenas um bit, apenas temos a capacidade de exprimir dois números. Se acrescentarmos mais um bit, o número de combinações possíveis duplica: ’00’, ’01’, ’10’ ou ’11’, o que significa que já podemos exprimir 2×2= quatro números.
O número de bits usados para representação determina a precisão (ou resolução) em amplitude do processo de amostragem referido anteriormente. Quanto mais bits forem usados, maior será essa resolução. Para conseguirmos uma resolução equivalente à de um sistema CD de áudio, são necessários 16 bits, o que significa que temos 65536 combinações numéricas possíveis. Os valores de amplitude amostrados são sempre arredondados para o código binário mais próximo.
O processo de reprodução é o inverso: as amostras são postas em sequência, à entrada de um outro dispositivo, um conversor digital-analógico, que vai tratar de reconstruir o sinal analógico, pronto para ser enviado para um altifalante (por exemplo).
A gravação digital é efectuada armazenando os valores das amostras, bit a bit, em sequência ordenada. Por exemplo, no caso da gravação em CD, cada bit é inscrito numa superfície reflectora de luz, alterando a característica de reflexão nesse ponto de maneira diferente, conforme se trate de um bit ‘1’ ou ‘0’. Se a superfície do CD se mantiver em condições aceitáveis, qualquer leitor de CDs terá pouca dificuldade em reconhecer um bit como ‘0’ ou ‘1’. Assim, uma gravação feita neste formato pode durar “uma vida”. Há porém um tipo de registo digital que é realizado em suporte magnético (como no caso dos discos rígidos nos computadores).
As placas de aquisição/reprodução de som presentes nos computadores (mais conhecidas como placas de som) servem como meio intermediário entre os computadores e o exterior. Elas são capazes de fazer a conversão analógico-digital do sinal eléctrico proveniente de um microfone, por exemplo, bem como a conversão digital-analógica. As taxas de amostragem e número de bits que a placa usa para aquisição não são fixos e podem ser programáveis.
Quando usamos um programa de computador que faz a aquisição de som através da placa de som, ele “diz-lhe” qual a taxa de amostragem e número de bits que deve usar para essa aquisição. As amostras de som serão recebidas sequencialmente pelo programa, submetendo-as ao processamento pretendido. Quando um programa de computador faz a reprodução de som, a placa de som é informada (pelo programa) da resolução em amplitude (número de bits) e do número de amostras por segundo com que a conversão digital-analógica deve ser realizada, antes do som ser reproduzido. Os dados serão enviados sequencialmente, e a placa de som “cuidará” do resto.
Critério de Nyquist
O teorema do criterio de Nyquist–Shannon é muito importante no campo da teoria da informação, especialmente na área de telecomunicações e processamento de sinais. Amostrar é o método no qual se converte um sinal numa sequência numérica. A versão de Shannon do teorema (onde fm é a maior frequência, em Hertz do sinal em questão) é:
“Seja um sinal, limitado em banda, e o seu intervalo de tempo dividido em partes iguais, de forma que se obtenham intervalos tais que, cada subdivisão compreenda um intervalo com período T segundos, onde T é menor do que 1/2*fm, e se uma amostra instantânea é tomada arbitrariamente de cada subintervalo, então o conhecimento da amplitude instantânea de cada amostra somado ao conhecimento dos instantes em que é tomada a amostra de cada sub-intervalo contém toda a informação do sinal original.”
Pode-se concluir então, que o teorema mostra que um sinal analógico, limitado em Banda, que foi amostrado, pode ser perfeitamente recuperado a partir de uma sequência infinita de amostras, se a taxa de amostragem for maior que 2*Fm amostras por segundo, onde Fm é a maior frequência do sinal original. Porém, se um sinal conter uma componente exactamente em Fm Hertz, e amostras espaçadas de exactamente 1/(2Fm) segundos, não se consegue recuperar totalmente o sinal.
Interpretações mais recentes do teorema são cuidadosas ao excluir a condição de igualdade; isto é, a condição de que x(t) não contém frequências maiores ou iguais a Fm; Tal condição é equivalente à excepção prevista por Shannon, quando uma função inclui uma componente estável sonora exactamente na frequência Fm.
O teorema assume uma concepção de qualquer situação do mundo real, uma vez que o mesmo só se aplica a sinais que são amostrados para tempo infinito; Um sinal x(t) limitado em tempo não pode ser perfeitamente limitado em Banda. A recuperação perfeita do modelo idealizado é matematicamente possível, mas é somente uma aproximação de sinais do mundo real, embora na prática seja uma aproximação muito boa.