Audio Numérique Leçon n 1 :Principes - Pascal Mignot
←
→
Transcription du contenu de la page
Si votre navigateur ne rend pas la page correctement, lisez s'il vous plaît le contenu de la page ci-dessous
U N IVERSIT É D E R EIMS C H AMP AGN E-A RD EN N E Audio Numérique Leçon n°1 :Principes Pascal Mignot Pascal.Mignot@univ-reims.fr
Rappels U N IVERSIT É D E R EIMS C H AMP AGN E-A RD EN N E son analogique Son = vibration des couches d’air. Dispositif audio de base: Une membrane couplée à un solénoïde (= une bobine). Enregistrement (micro) Un son fait mécaniquement vibrer la membrane, qui déplace la bobine qui produit un courant électrique. Signal Analogique Ecoute (Haut-parleur) Le courant électrique fait se déplacer la bobine, qui fait vibrer la membrane, qui fait mécaniquement se déplacer les couche d’air. Signal Analogique Note: si on renvoie le courant électrique généré par un son dans une bobine, on réobtient le même son (exemple de la fréquence unique). Courant = fonction s(t), l’espace temporel t est continu (à notre échelle, conjecture 10-42) = signal analogique.
U N IVERSIT É D E R EIMS Vitesse du son C H AMP AGN E-A RD EN N E Dépend: • du milieu de propagation (air, eau, métal, …) • de la température Vitesse dans l’air (en m/s, Tc = température de l’air en degré Celsius). VS = 20.05 × TC + 273.15 ≈ 331.4 + 0.6 × TC A température ambiante (20°), Vs = 343 m/s. Autres milieux: Oscillation Oscillation longitudinale transverse Liquide VL Corps VL Matériaux VT Matériaux VL VT Eau à O° 1402 Crane 4080 Erable 4110 Aluminum 6420 3040 Eau à 20° 1482 Muscle 1585 Brique 3650 Acier 5790 3100 Mer à 20° 1522 Chair 1540 Marbre 3810 Or 3240 1200 Huile de castor 1477 Sang 1570 Liège 500 Pyrex 5640 3280
Mesure du son U N IVERSIT É D E R EIMS C H AMP AGN E-A RD EN N E fréquence, période et longueur d’onde Rappel pour un signal périodique: T = druée d’une période (en seconde) f = nombre de période par seconde (en Hertz) λ = longueur d’onde (en mètre) Rappel des liens entre ces quantités: f = 1/T λ = c / f (où c est la vitesse de déplacement de l’onde; pour le son c=343m/s). Frequence (Hz) 63 125 250 500 1K 2K 4K 8K Longueur d’onde (m) 5.46 2.75 1.38 0.69 0.34 0.17 0.085 0.043
Mesure du son U N IVERSIT É D E R EIMS C H AMP AGN E-A RD EN N E puissance et intensité Puissance sonore: N (en W): puissance de référence: N0 = 10-12W (limite d’audibilité). niveau de puissance (en dB): Lw = 10 log (N/N0) en général pour mesure la puissance d’une source sonore (voir la table ci-après). L’étendue des puissances audibles justifie l’utilisation d’une échelle logarithmique. Intensité sonore: I (en W/m2) intensité de référence: I0 = 10-12 W/m2 (limite d’audibilité). niveau d’intensité (en dB): Li = 10 log (I/I0) Note: log = le log en base 10
Source N (W) Lw (dB) Saturn Rocket 100,000,000 200 Jet engine 100,000 170 U N IVERSIT É 10,000 160 D E R EIMS CInside jet H AMP AGN engine E-A RD EN N Etest cell 1,000 150 Large centrifugal fan, 800.000 m3/h 100 140 Axial fan, 100.000 m3/h, Symphonic orchestra 10 130 Large chipping hammer, Human pain limit 1 120 Large aircraft 150 over head, Centrifugal van, 25.000 m3/h, Blaring radio 0.1 110 Large air compressor, Air chisel, Magnetic drill press, High pressure gas 0.01 100 leak, Banging of steel plate, Drive gear, Car on highway, Normal fan Cut-off saw, Hammer mill, Small air compressor, Grinder, Heavy diesel vehicle, Heavy city traffic, Lawn mover, Maximum sound up to 8 hour 0.001 90 (OSHA1) criteria - engineering or administrative noise controls), Jackhammer at 15 m, Bulldozer at 15 m Maximum sound up to 8 hour (OSHA criteria - hearing conservation program), Pneumatic tools at 15 m, Alarm clock, Buses, trucks, motorcycles 0.0001 80 at 15 m, Dishwasher Car at 15 m, Vacuum cleaner at 3 m, Voice, conversation 0.00001 70 Large department store, Busy restaurant or canteen 0.000001 60 Room with window air conditioner 0.0000001 50 Voice, low 0.00000001 40 Voice, soft whisper, Room in a quiet dwelling at midnight 0.000000001 30 Noise at ear from rustling leaves 0.0000000001 20 Quietest audible sound for persons under normal conditions 0.00000000001 10 Quietest audible sound for persons with excellent hearing under laboratory 0.000000000001 0 conditions2)
Mesure du son U N IVERSIT É D E R EIMS le décibel C H AMP AGN E-A RD EN N E Source Lp (dB) Threshold of hearing 0 Utilisée pour le mesure d’une puissance reçue. Rustling leaves 20 Quiet whisper (1 m) 30 Pression sonore: p (en N/m2 ou Pa) Home 40 pression de référence: P0=2.10-5 N/m2 (limite Quiet street 50 d’audibilité). niveau de pression (en dB): Conversation 60 Lp=10 log( P2 / P02 ) Inside a car 70 remarques: Loud singing 75 1. si la pression est doublée, le niveau Automobile (10 m) 80 augmente de 6dB ( = 20 log 2). Motorcycle (10 m) 88 2. C’est cette quantité que est utilisée pour mesurer le niveau sonore d’un bruit. Food blender (1 m) 90 3. Il s’agit de rapport, donc Lp , Li et Lw Subway (inside) 94 réprésentent la même quantité. Diesel truck (10 m) 100 Notes: Lawn mower (1 m) 107 – Mesurable avec un microphone (pression Pneumatic riveter (1 m) 115 sur la membrane). Chainsaw (1 m) 117 – La pression sonore est utilisée pour Amplified Hard Rock (2 m) 120 quantifier le niveau du son. Jet plane (30 m) 130
Loi de l’inverse du carré U N IVERSIT É D E R EIMS C H AMP AGN E-A RD EN N E de la distance Cette loi décrit la décroissance de l’intensité sonore I (en W/m2) d’une source de puissance P (en W) à une distance d (en m): P I= 4πd 2 Autrement dit, si on double la distance, l’intensité sonore est divisée par 4. Exemple: voiture sur l’autoroute, P=0.01W, à 15 mètres, I = 0.01 / 4π.152 = 3.5 x 10-6 W/m2 ⇒ I = 65dB distance 1 2 4 8 16 32 64 128 256 512 1024 I (dB) 89 83 77 71 65 59 53 47 41 35 29 Note: cette loi ne prend pas en compte les effets atmosphériques.
U N IVERSIT É D E R EIMS C H AMP AGN E-A RD EN N E Aspects Psycho-auditifs
Aspects psycho-auditifs U N IVERSIT É D E R EIMS C H AMP AGN E-A RD EN N E le spectre audible phoque ultrason 200Hz 55kHz infrason spectre audible: 20Hz → 20KHz 70Hz baleine 150kHz 1kHz rongeur 100kHz En dessous: 100Hz sauterelle 50kHz infra-son 1kHz chauve-souris 150kHz Au dessus: 16Hz vache 40kHz ultra-son 16Hz éléphant 12kHz 31Hz cheval 40kHz Voix humaine: 40Hz chien 46kHz 600Hz → 4KHz 100Hz chat 32kHz 20Hz homme 20kHz 1 2 3 4 5 6 10 10 10 10 10 10 Hz
Aspects psycho-auditifs U N IVERSIT É D E R EIMS C H AMP AGN E-A RD EN N E le volume (loudness) Deux sons différents de X dB ne semblent en général pas avoir le même volume, i.e. la perception du volume d’un son n’est pas simplement liée à la pression sonore (ou à l’énergie ou à l’intensité sonore). N phons = niveau sonore de N dB d’un ton de fréquence 1KHz. L’intensité perçue d’un son dépend de sa fréquence. Interprétation: • les sons graves sembles avoir un volume plus bas. • fréquences que l’on entend le mieux (500-7KHz). courbes perceptuelle iso-volume
Aspects psycho-auditifs U N IVERSIT É D E R EIMS C H AMP AGN E-A RD EN N E fréquence/volume L’échelle des fréquences perçues par l’oreille humaine dépend de l’intensité sonore: • à faible niveau sonore, on perçoit les hautes fréquences. • l’étendue des fréquences entendues s’étend avec l’intensité. A noter que la perception des hautes fréquences se détériore avec l’age.
Aspects psycho-auditifs U N IVERSIT É D E R EIMS C H AMP AGN E-A RD EN N E la tonalité (pitch) Tonalité = perception humaine de la fréquence. En musique, • Octaves un octave = intervalle entre 2 gammes octave suivant = multiplier la fréquence par 2. • Notes note suivante = multiplier la fréquence par 21/12. • Accord de base Note F0 F1 F2 deux notes jouées en même temps dont le Do 8.176 16.352 32.703 rapport est l’un des suivants: 3/2, 4/3, 5/4, Do# 8.662 17.324 34.648 6/5, 5/3, 8/5, 2 Ré 9.177 18.354 36.708 Ré# 9.723 19.445 38.890 Mi 10.301 20.601 41.203 Do Ré Mi Fa Sol Si Do Fa 10.913 21.826 43.653 Echelle Fa# 11.562 23.124 46.249 Logarithmique Sol 12.250 24.499 48.999 Do# Ré# Fa# La# Sol# 12.978 25.956 51.913 La 13.750 27.50 55.000 La# 14.568 29.135 58.270 f 21/12f 25/12f 29/12f 2f Si 15.434 30.867 61.735
U N IVERSIT É D E R EIMS Harmoniques et Timbre C H AMP AGN E-A RD EN N E En général, pour un instrument du musique ou chaque phonème d’une voix, le son produit n’a pas une fréquence unique. Harmoniques = multiples (entiers) de la fréquence fondamentale. Exemple pour un violon avec une fréquence fondamentale à f=392Hz. Les pics de fréquence suivants sont à 2f, 3f, 4f, … Timbre = “mélange” de la fréquence fondamentale et de ses harmoniques (= caractéristique d’un instrument).
U N IVERSIT É D E R EIMS C H AMP AGN E-A RD EN N E Conversion Analogique-Numérique
Signal numérique U N IVERSIT É D E R EIMS C H AMP AGN E-A RD EN N E conversion A/N : échantillonnage Echantillonnage: représenter le signal s(t) par une suite de couple {ti,s(ti)} dans le cas de l’échantillonnage uniforme : ti = t0 + i.δ avec δ = pas d’échantillonage (intervalle de temps entre deux échantillons, en seconde), f = 1/ δ fréquence d’échantillonnage (nombre d’échantillons par seconde, en Hz). si = s(ti), l’échantillon associé à l’instant ti. Théorème de Nyquist: pour représenter correctement un signal de fréquence maximale fmax, il faut l’échantillonner avec une fréquence fmax/2. • Représentation correcte = pouvoir reconstruire exactement le signal analogique à partir du signal discret. • Critère évident … si l’on regarde ce qui se passe dans l’espace de Fourier. • Ne prend pas en compte la quantification. Corollaire: Si le signal a une fréquence supérieure à la fréquence d’échantillonnage fmax, il faut filtrer les fréquences supérieures à fmax/2. Si ces critères ne sont pas respectés: aliasing (repliement de spectre, cf cours SI/TI).
Signal numérique U N IVERSIT É D E R EIMS C H AMP AGN E-A RD EN N E conversion A/N : quantification le signal {si} est discret, mais les valeurs si sont analogiques (prennent leurs valeurs dans un espace continu). Objectif: obtenir des valeurs codées en binaire. Quantification : l’intervalle de variation du signal [vmin,vmax] (global), est subdivisé en n=2p sous-intervalles Ij = [vj,vj+1]. la valeur si est codée par le nombre binaire j tel que si∈Ij erreur de quantification: |Ij|/2 quantification uniforme: les intervalles Ij ont tous la même taille (vrai pour l’audio). Reconstruction: la valeur reconstruite à partir du nombre binaire j est le centre de l’intervalle Ij.
Signal numérique U N IVERSIT É D E R EIMS C H AMP AGN E-A RD EN N E conversion A/N Quantification sur cet axe Echantillonnage sur cet axe
Signal numérique U N IVERSIT É D E R EIMS C H AMP AGN E-A RD EN N E quantification, aliasing & dithering une variation d’amplitude de l’ordre d’un bit (LSB) de la quantification peut engendrer un signal audio périodique cohérent (aliasing). l’ajout d’un bruit aléatoire (de l’ordre d’un demi-LSB) permet d’enlever toute cohérence au « bruit » de quantification.
Signal numérique U N IVERSIT É D E R EIMS C H AMP AGN E-A RD EN N E Quantification et dynamique Le volume est directement codé à partir de la quantification uniforme de la pression sonore (pas d’aspect psycho-auditifs utilisé). Dans notre cas, si on utilise n bits, • on peut coder l’amplitude comme des valeurs de -2n-1 à 2n-1. • l’erreur de quantification est au plus de 2-1 (différence maximale entre la valeur du signal analogique et la valeur choisie) et ceci indépendamment de l’échelle (plage de variation) choisie. Le rapport signal sur bruit (SNR) dans le cas d’un signal numérique sonore se calcule comme: Psignal 2 n −1 SNR= 20. log = 20. log −1 = n × 20 log 2 = 6.02 × n (en dB) Bits par dB Pbruit 2 valeur max. 8 48 On obtient ainsi directement la dynamique possible pour notre signal 16 96 (en gros, 1 bit de résolution par 6dB). 20 120 Clairement, on n’a pas envie de dépasser une dynamique de plus de 24 144 120dB (limite de tolérance), donc une quantification de 20bits. 32 192
Signal numérique U N IVERSIT É D E R EIMS C H AMP AGN E-A RD EN N E stockage au format PCM PCM = Pulse Code Modulation technique pour enregistrer les données sur un support numérique. la durée des impulsions détermine le nombre de 1, la durée d’absence d’impulsion le nombre de 0. les bits sont envoyés les uns à la suite des autres. Surface d’un CD-Rom observée avec un microscope électronique. …001001100100111…
Signal numérique U N IVERSIT É D E R EIMS enregistrement sur un support numérique au C H AMP AGN E-A RD EN N E format PCM à partir d’une source analogique Filtre d’anti-aliasing : filtre passe-bas. Multiplexer : interlace les deux signaux Sample and Held : prend un échantillon numérique en un seul signal. et garde sa valeur (sortie = suite de Processing : ajout de codes correcteurs paliers) d’erreur. A/N converter = échantillonnage + Record modulation : conversion en quantification. PCM.
U N IVERSIT É Signal numérique D E R EIMS C H AMP AGN E-A RD EN N E lecture d’un support numérique au format PCM et restitution sur une sortie analogique
Signal numérique U N IVERSIT É D E R EIMS C H AMP AGN E-A RD EN N E valeurs typiques Valeurs typiques pour l’audio: échantillonnage: 8, 32, 44, 96, 192 kHz quantification: 8, 10, 16, 20, 24 bits nombre de canaux = nombre de pistes: stéréo = 2 canaux indépendants, 5.1 = 5 canaux indépendants (basse = filtrage passe-bas) Valeur typique d’échantillonnage: 8 KHz téléphone 11.25 KHz voix 22.5 KHz musique (qualité radio AM) 32 KHz musique (qualité radio FM), Nicam 44.1 KHz CD 48 KHz DAT ou DVD Valeurs typique pour l’audio numérique haut qualité: CD : 16bits @ 44kHz stéréo, soit 2 x 16 x 44.000 = 1.4 Mbits/s DVD Dolby Digital: 48KHz @ 16,20 ou 24 bits sur 1 à 7 canaux. pour un son 5.1 à 48KHz @: 24 bits : 5 x 48.000 x 24 = 5.76 Mbit/s DVD audio: jusqu’à 24 bits @ 192kHz sur 2 canaux (stéréo) soit 24 x 192000 x 2 = 9.2 Mbits/s
U N IVERSIT É D E R EIMS C H AMP AGN E-A RD EN N E Aspects matériels
Signal numérique U N IVERSIT É D E R EIMS C H AMP AGN E-A RD EN N E échantillonnage et quantification en pratique La dynamique et les fréquences audibles font qu’il ne sert a priori à rien d’échantillonner au-delà de 44kHz @ 16 bits. Pourtant, certains équipements HI-FI échantillonnent bien au-delà (ex:DVD-audio). Pourquoi suréchantillonner? • limite les erreurs de quantification lors de l’enregistrement du signal original. • permettre les prétraitements (filtres d’ambiance, etc…) sans perte par rapport au signal final souhaité (44kHz@16bits); i.e. le cumul des erreurs de quantification apparaît au-delà. Conséquence: • pour une application audio classique, inutile de dépasser 44kHz@16 bits. • 22 kHz : difficile de passer en dessous (exemple: criquets, symbale).
U N IVERSIT É D E R EIMS amplification et atténuation C H AMP AGN E-A RD EN N E Les périphériques audio ou HIFI modernes n’amplifie pas le son mais l’atténue (permet de limiter les problèmes de distorsion liés à l’amplification). avant: 0 = silence 100 = maximum maintenant: 0 dB = maximum, -n dB = atténuation du son maximum de n dB. Conséquence: les APIs suivent le mouvement. Exemple: DirectSound volume de -10.000 à 0. atténuation en 100ème de décibel (i.e. -10.000 = atténation de 100dB).
Reproduction U N IVERSIT Étype de HPs D E R EIMS C H AMP AGN E-A RD EN N E 3 principaux types de HPs: • woofers dédiés aux basses fréquences (en dessous de 500Hz). • midrange dédiés aux fréquences moyennes (de 250 à 2.500Hz). • tweeter dédiés aux hautes fréquences (de 1KHz à 20KHz). Enceinte = combinaisons de HPs et de filtres. Enceinte idéale = filtre dont la réponse est plate (ne privilégie aucune fréquence). Actuellement, maillon faible dans la chaîne de reproduction d’un son.
U N IVERSIT É D E R EIMS Systèmes de HP C H AMP AGN E-A RD EN N E 4.1 5.1 6.1 7.1 « Audio 3D » • rendu latéral positionnement circulaire (champs sonore 360° degrés) et dans le plan aural (celui passant par les oreilles et dont la normale est l’axe vertical). • rendu vertical pas de dispositifs répandus jusqu’à présent (pour un rendu sphérique)
U N IVERSIT É D E R EIMS Cartes son actuelles C H AMP AGN E-A RD EN N E • 32 à 128 canaux (= sons différents pouvant être joués en même temps). • mixage hardware • effets et reverb (réverbération) hardware • son hardware 3D suit les cartes graphiques 3D et le besoin de créer des environnements sonore 3D. HRTF (détaillé dans la partie son 3D): reconstituer un environnement 3D à partir de n HPs. • la mémoire système peut être utilisée par le périphérique audio (peu ou plus de mémoire sur les cartes audio) raison: bus PCI conséquences: plus de différence entre les buffers streaming (toujours en mémoire système) ou static (mémoire « locale »)
Cartes son actuelles U N IVERSIT É D E R EIMS C H AMP AGN E-A RD EN N E Exemple: audigy 4 Processeur Audigy 4 Pro Traitement avancé des effets numériques Traitement numérique 32 bits maintenant une gamme dynamique théorique de 192 dB Interpolation 8 points brevetée réduisant la distorsion à des niveaux inaudibles Synthétiseur matériel à table d'ondes de 64 voix Mixage et égalisation numériques de qualité professionnelle Qualité audio haute définition pour la lecture et l'enregistrement Lecture de 64 canaux audio, avec un taux d'échantillonnage arbitraire pour chaque canal Conversion analogique/numérique 24 bits d'entrées analogiques avec un taux d'échantillonnage de 96 kHz Conversion numérique/analogique 24 bits de sources numériques à un taux de 96 kHz en sortie haut-parleurs 7.1 analogiques Conversion numérique/analogique 24 bits de sources numériques stéréo à un taux de 192 kHz en sortie stéréo Taux d'échantillonnage d'enregistrement de 16 à 24 bits : 8 ; 11.025 ; 16 ; 22.05 ; 24 ; 32 ; 44.1 ; 48 et 96 kHz. Prise en charge du format SPDIF (Sony/Philips Digital Interface) jusqu'à 24 bits/96 kHz. Taux d'échantillonnage sélectionnable de 44.1 ; 48 ou 96 kHz Enregistrement multipistes à faible temps de latence avec prise en charge ASIO 2.0 à une résolution de 16 bits/48 kHz et 24 bits/96 kHz. Performance Audio Rapport Signal sur bruit (AES17, A-Weighted) Sortie Stereo 113dB Canaux Avant et Arrière 113dB Centre, Caisson de basse, Canaux latéraux 113dB Distorsion Harmonique Totale + bruit à 1kHz (AES17) = 0.003% (2V sortie à 2V) Réponse en fréquence +/-3dB: 10Hz à 46kHz
U N IVERSIT É D E R EIMS Et maintenant, C H AMP AGN E-A RD EN N E A venir: • programmation bas-niveau avec DirectSound. niveau buffer • programmation audio environnemental. synthèse d’environnement sonore • programmation haut-niveau avec DirectMusic. gestion transparente des buffers et des formats En avant!
Vous pouvez aussi lire