Le retour des FFT
Par Contributeur - Publié le
Niouse du 30 Avril 2003:
Apple a introduit récemment le AAC comme format de diffusion dans son service de musique en ligne. Mais que vaut ce format par rapport au MP3 ou au CD ? C'est un sujet qui est en discussion en ce moment et il est n' pas toujours évident de faire la part des choses.
Alors par curiosité j'ai fait une série de tests simples. Avec Felt Tip Studio j'ai pris des extraits des FFT (Transformées de Fourier) qui donne une idée du spectre d'un passage musical. J'ai utilisé un extrait de 8 secondes de la Marche des Turcs dans le CD Tous les matins du monde, sur un passage orchestral et j'ai comparé les différentes FFT des fichiers compressés afin d'observer leur fidélité avec le signal original. Il apparait que les mp3 sont dans les choux quelque soit le débit choisi comparé au AAC. La fidélité est bien plus grande dans toutes les gammes de fréquences; on retrouve les articulations du son même s'il y a un manque de dynamique par rapport à l'original sur certaines fréquences.
L'augmentation du débit n'amène pas de grandes différences pour l'AAC sauf dans les fréquences plus hautes qui demeurent plus proches de l'original.
Toutefois il y a une chose à ne pas perdre de "vue", les codec d'iTunes sont tous très bons et il faut du bon matériel hi-fi pour entendre des différences. Je peux juste dire que le MP3 à 128 kbits possède un peu moins de définition sonore, le son est moins présent, moins brillant que l'original, mais rien de bien flagrant. Les FFT font un effet de loupe utile pour faire un choix, au cas où... J'ai l'intention de faire d'autres tests dans d'autres conditions, avec d'autres styles de musique...
Cette précision étant faite, laissons les ustensiles de cuisine à Noxx...
Le retour des F.F.T.
Avec le développement des systèmes de téléchargements payants de musique sur Internet, chacun y va de son appréciation sur le meilleur codec de compression et du débit minimal de tout mélomane averti. Ce sujet m’intéressant également, j’ai voulu en avoir le cœur net. Mais au lieu de me contenter des tests auditifs, j’ai cherché un moyen objectif de mesurer la qualité des algorithmes de compression. Pour cela j’utilise Sound Studio qui me permet de décomposer un signal audio en FFT, c’est-à-dire en français les “transformées rapides de Fourier”.
Cette décomposition permet de donner une idée du spectre harmonique d’un extrait musical : cela correspond à la puissance du signal en fonction des fréquences du spectre audible. Chaque instrument possède un spectre particulier qui permet sa reconnaissance par l’oreille.
Ainsi pour restituer précisément le timbre d’un instrument, il faut que l’algorithme soit capable de restituer le maximum d’éléments de son spectre. Les FFT permettent de les inscrire dans un graphique, ce qui fait que l’on compare avec les yeux et non plus avec les oreilles. Et les moyens Hi-Fi de restitution n’entre plus en ligne de compte.
Un extrait musical en AIFF (ou WAV c’est pareil) nous servira d’étalon puisque toutes les composantes du spectre du morceau sont présentes. J’ai choisi un extrait de 2 secondes pour ne pas surcharger le spectre, mais dès que l’on passe aux aigus, les choses deviennent un peu confuses, toutefois des “articulations” du signal restent visibles. C’est un extrait du groupe Slayer : on aime ou on n’aime pas, mais force est de constater que c’est exigeant côté signal.
AIFF
J’avais déjà fait ce genre de comparaisons, mais cette fois j’ai voulu tester tous les principaux codecs du marché : AAC par iTunes, OGG par Quicktime, WMA par Windows Mdeia player 9, MP3 par iTunes et Audion et MP3 pro par Audion. Si cela n’est pas indiqué c’est que le débit est à 128 kb/s, qui semble être devenu la norme. Il apparaît assez nettement trois classes de codec : les excellents, les intéressants et les standards.
WMA
OGG
And the winner is... WMA. Ben si… cela m’agace autant que vous, mais le codec de Microsoft semble être celui capable de restituer avec le plus de fidélité le signal original. Il est suivi de très près par le OGG d’Ogg-Vorbis. À vrai dire, jusqu’à 1 Khz la fidélité du signal compressé n’est pas loin d’être parfaite pour les deux codecs. C’est après que les choses se gâtent. On remarquera que les deux codecs coupent un peu des hautes fréquences, mais le WMA me semble respecter un peu mieux l’équilibre des aigus que OGG qui accentue plus de choses.
AAC
On remarquera que la AAC s’en sort pas mal mais il déséquilibre davantage le signal que les deux autres codecs jusqu’à 1Khz et “mange” les extrêmes aigus et les extrêmes graves. Cependant on retrouve les inflexions du signal sur l’ensemble du spectre.
Ces trois codecs sortent du lot : on retrouve toutes les principales articulations de la musique. Je donnerai une mention spéciale pour OGG qui est libre de droit et comparable au WMA.
Ensuite arrivent les MP3 :
MP3 pro 64 Kb/s
MP3 d’iTunes
On peut observer qu’avec le MP3 les choses deviennent, disons… plus approximatives. Clairement le MP3pro est très intéressant puisque qu’avec un débit deux fois moindre il se permet d’être plus proche de l’original que le MP3 d’iTunes. On aurait pu penser que ce MP3pro à 96 kb/s (maximum autorisé) doit être extraordinaire, que nenni… Mais j’en reparlerai plus loin.
J’ai également fait un test avec le MP3 de Lame en utilisant Audion. Certains ne jugent que par ce codec en affirmant qu’il est très supérieur au reste…
MP3 de Lame
C’est mieux que le MP3 d’iTunes surtout dans les aigus, mais enfin on voit surtout que c’est du MP3…
Je classerais ces deux derniers codecs dans les standards : qualité suffisante dans la plupart des cas.
On pourrait me reprocher de n’avoir fait des tests qu’à un seul débit et que le MP3 à 192 kb/s vaut sans doute le AAC à 128 kb/s… Ben non.
3 de Lame à 320 kb/s
Comme vous pouvez le constater la différence n’est pas flagrante avec le même MP3 à 128 kb/s, seuls les aigus semblent accentués et encore peut-être de manière outrancière. Comment expliquer la chose ?
Ces codecs ont visiblement des débits optimum au-delà desquels ils ne savent pas trop quoi faire et quoi prendre dans le spectre.
En effet, les codages se font grossièrement en deux étapes : d’abord un filtrage où l’essentiel est la décomposition en FFT et ensuite un codage numérique des FFT qui semblent indispensables. On peut penser que certains filtrages sont plus " myopes " que d’autres et incapables de coder certaines subtilités du signal. D’où du débit pour rien ou presque. Le cas le plus flagrant est pour le MP3pro où je n’ai pu observer la moindre différence de spectre entre le débit à 64 kb/s et 96 kb/s. Le marketing existe aussi dans le monde des codecs où l’on fait croire que plus de débit est l’assurance de qualité.
Conclusions
Quelles conclusions ? Si l’on n’aime pas le WMA, il y a l’OGG, et puis le AAC n’est pas infamant. Sinon le MP3pro est vraiment intéressant par rapport au poids du fichier généré. Cependant ne perdez pas de vue que les FFT réalisent un effet de loupe sur le signal qui accentue les dissemblances et que ces dissemblances sont, à l’oreille, souvent loin d’être évidentes.
Addendum
[NDRE: En ce début d'année, nous venons de recevoir, un petit complément de la part de Noxx, sur le format MPC.]
J'ai eu un peu de temps devant moi et je me suis attelé au test d'un dernier format qui fait parler de lui : le MPC.
J'ai utilisé Musetools 2.0 pour cela. Les réglages sont plus aléatoires, je n'ai obtenu qu'un débit d'environ 135 kbs en qualité 4. Je n'ai pas trouvé comment être plus précis sur le débit.
Il apparaît que le MPC est un excellent format, à placer dans le groupe de tête avec OGG, WMA et AAC. On voit que toutes les fréquences basses semblent restituées dans leurs détails, par contre il "coupe" davantage le son dans les aigus où clairement OGG et WMA ont une bande passante plus large. Bref, il ne change pas le palmarès. Ce codec semble davantage destiné aux hauts bitrates : peut-être d'autres tests seraient utiles avec de hauts bitrates à 192 Kbs ? Qu'en pensez-vous ?
Voilà, je ne pense pas avoir oublié grand monde cette fois-ci.