Representação do som – Eduardo e Bruno

março 26, 2019 Off Por eduardobasso
  1. Digitalização de som
    amostragem é um processo de discretização temporal do sinal analógico contínuo. Num sinal digitalizado, cada amostra é representada usando-se um valor em um conjunto finito de valores discretos; é o processo de quantização.A digitalização é realizada por um equipamento chamado conversor analógico-digital (ADC), e possui basicamente três etapas: (1) o sinal passa por um filtro que remove freqüências que não podem ser representadas; (2) após a filtragem, o sinal é amostrado; (3) por fim, as amostras são quantizadas e codificadas em sistema binário. O processo inverso, que reproduz o sinal, é realizado por um conversor digital-analógico (DAC).Os dois principais atributos da representação digital de um sinal são a taxa de amostragem e o formato das amostras.
    • Taxa de amostragem
      A amostragem (discretização temporal) é realizada tomando-se periodicamente amostras dos valores instantâneos do sinal analógico. A taxa de amostragem é a freqüência com que são tomadas as amostras.A taxa de amostragem padrão do CD de áudio é de 44.100 Hz. As fitas DAT utilizam taxa de amostragem de 48 kHz.
    • Formato da amostra
      Em um sinal digital, amostras são quantizadas e armazenadas usando-se um determinado número de bits para representar cada amostra. O número de bits determina o número de valores possíveis de ser representados. Cada amostra precisa ser “arredondada” para um valor próximo disponível. Os erros de aproximação causam uma deformação do sinal em relação ao original (analógico), o ruído de quantização. A relação sinal/ruído pode ser computada a partir no número de bits.Normalmente, convenciona-se que os valores permitidos na representação da amplitude instantânea de som digital situam-se no âmbito de -1.0 a 1.0. Valores que extrapolem esse âmbito são normalmente sujeitos a clipping (ou saturação), isto é: valores maiores que 1.0 são substituídos por 1.0, e valores menores que -1.0 são substituídos por -1.0, resultando no efeito de distorção do sinal. Para evitar saturação, é preciso garantir (seja na gravação ou no processamento) que a amplitude do sinal não vá ultrapassar a amplitude máxima permitida.CDs de áudio utilizam amostras de 16 bits, o que permite representar 65.536 valores diferentes de amplitude instantânea.
  1. Teorema da amostragem de Nyquist[/Shannon]
    Segundo o Teorema de Nyquist, a freqüência de amostragem de um sinal analógico, para que possa posteriormente ser perfeitamente reconstituído, deve ser igual ou maior a duas vezes a maior freqüência do espectro desse sinal. A tentativa de representar freqüências superiores à freqüência de Nyquist faz com que essas freqüências sejam defectivamente mapeadas para regiões inferiores do espectro, deturpando o sinal (aliasing).Portanto, usando-se a taxa de amostragem dos CDs, 44.100 Hz, não é possível representar freqüências maiores que 22.050 Hz.

O exemplo a seguir ilustra o processo de digitalização. Do sinal original (linha verde) tomam-se amostras (bolinhas vermelhas) igualmente espaçadas no tempo (eixo horizontal). Os valores dessas amostras (eixo vertical, amplitudes instantâneas), são quantizadas em valores de -1 a 1, separados por intervalos de 0.25 (quadradinhos azuis).

Amostragem e quantização de um sinal

FORMAS DE REPRESENTAÇÃO DO SOM

Representação temporal

Esta representação mostra a evolução da intensidade do sinal sonoro no do tempo.

A parte azul mostra a evolução da intensidade dum som vocal no tempo. esta visão temporal permite, sobre tudo, constatar a evolução do envelope temporal (linha vermelha) que, por exemplo, desempenha um papel importante na perceção da palavra.

Representação frequencial (ou espetral)

Esta representação permite visualizar a composição frequencial dum som e também a intensidade de cada frequência.

Representação frequencial (ou espetral)

Neste gráfico é possível observar a composição espetral da palavra precedente. neste exemplo constata-se que as frequências do som selecionado se estendem de 80 Hz a 15500 Hz.

Representação tridimensional: O sonograma ou espetrograma.

Trata-se de representação tempo-frequencial do som. É o desenho da repartição da energia do som em função do tempo e das frequências. O sonograma é muito utilizado para estudar o sinal de voz. 

tridimensionnelle

O exemplo apresentado ao lado demonstra bem a evolução da frequência e da intensidade no tempo. A intensidade é definida pela cor, sendo maior quanto mais se aproxima do vermelho. No exemplo distinguem-se bem os formantes das vogais, as formantes transitórias, etc. (linhas negras), os movimentos que têm um papel importante na perceção da palavra.

Referencias

http://www.cochlea.eu/po/som/representacao-do-som

https://hudlac.wordpress.com/tag/quantizacao/