Nous vivons actuellement, grâce au numérique, une révolution caractérisée par la fusion de la radiodiffusion, des télécommunications et des technologies de l'information. La compression vidéo se situe au cœur de ce processus. La compression est pratiquement indisso- ciable de la vidéo pour répondre aux restrictions inhérentes à la capacité de stockage et à la largeur de bande requise par les données – qu'il s'agisse de la production, du stockage et de la distribu- tion ainsi que de la radiodiffusion du produit fini.

À l'extrémité supérieure de la qualité, la compression est vitale pour la TVHD et le cinéma numérique ainsi que pour la diffusion de contenus par Internet et la téléphonie mobile. La compression est omniprésente dans l'électronique grand public, notamment les lecteurs DVD, les téléviseurs numériques, les caméras vidéo, Internet et les PC. Il s'agit incon- testablement d'une technologie cruciale que les radiodiffuseurs doivent comprendre et utiliser efficacement à un prix raisonnable.

La BBC joue depuis plusieurs années un rôle d'avant-garde dans le développe- ment de la radiodiffusion numérique. Compte tenu de son importance, la BBC a travaillé à la mise au point d’un codec de compression vidéo très performant. En mars 2004, son département R&D a lancé un logiciel expérimental de compression/décompression vidéo appelé Dirac. Ce codec très efficace vise diverses applications, de la TVHD à la diffusion de contenus Web. Fondé sur une technologie ouverte, il est à la dispo- sition de toute personne ou organisme qui souhaitent l’utiliser, à quelque fin que ce soit, sans payer de droits. Le codec doit son nom au physicien britannique, Paul Dirac.

MalgrĂ© sa notoriĂ©tĂ© modeste, Dirac (1902-1984) a Ă©tĂ© l’un des scientifiques les plus importants du XXe siècle . En 1933, il a obtenu le prix Nobel de physique avec Erwin Schrödinger pour sa contribution Ă  la mĂ©canique quantique. Ă€ l'occasion de l’inauguration en 1995 d’une plaque commĂ©morative Ă  la mĂ©moire de Dirac Ă  l'abbaye de Westminster (Londres), Steven Franken Hawking – l'actuel titu- laire de la chaire Lucasian de mathĂ©ma- tiques Ă  Cambridge (occupĂ©e en son temps par Dirac) – dĂ©clarait : « personne en ce siècle, Ă  l'exception d'Einstein, n'a contribuĂ© autant que Dirac au progrès de la physique et Ă  l’évolution de notre perception de l'univers. »

Cet article offre un aperçu du système de compression vidéo Dirac. Il analyse les tentatives déployées dans ce domaine ainsi que les raisons sous-tendant ces travaux. Il présente les technologies et le logiciel Dirac, examine certains aspects des performances du codec et en aborde les perspectives.

Dirac en contexte Des données vidéo en définition stan- dard1 non compressées, qui proviennent directement de la caméra, requièrent un débit de l'ordre de 200 Mbit/s. Il est beaucoup trop important, qu'il s'agisse du stockage ou de la transmission. Le format de compression vidéo MPEG- 2 , apparu au début des années 90, s’impose alors comme le système incon- tournable pour les applications de radio- diffusion. Il permet de réduire le débit binaire brut d'une caméra d'un facteur d'environ 50. MPEG-2 s'avère donc la solution pour l’adoption à grande échelle de la télévision définition standard (SDTV) et les DVD.

Le développement tous azimuts de la technologie numérique modifie aujourd’hui de toute évidence le pano- rama de la radiodiffusion. Nombre de nouvelles technologies, telles que la TVHD, la diffusion de contenus sur Internet et la TV/IP (TV large bande), occupent le devant de la scène. Le véné- rable format de compression MPEG-2 commence à montrer ses limites. Un autre système, aux performances supé- rieures, est tout simplement nécessaire pour utiliser au mieux la largeur de bande disponible.

MPEG-4 Partie 2, normalisée en 1999, améliore la norme précédente mais ses gains de codage de 15 à 20 % ne justifient pas les frais indispensables pour son adoption à grande échelle. Au cours des dernières années, d'autres technologies de compression – notam- ment H.264 (également connue sous le sigle AVC et MPEG-4 Partie 10) , Windows Media , Real Video et On2 – voient le jour, améliorant de manière substantielle les performances du format MPEG-2 initial, grâce à une réduction de 50% du débit à qualité équivalente.

En d'autres termes, nous pouvons garantir la qualitĂ© diffusion multimĂ©dia en temps rĂ©el (streaming media) Ă  quelques centaines de kbit/s, la qualitĂ© TV standard Ă  environ 2 Mbit/s et TVHD Ă  environ 10 Mbit/s. Technologie ouverte L’éventail de codecs Ă©tant dĂ©jĂ  très large, qu’est ce que Dirac apporte de plus aux radiodiffuseurs ?

Il se caractérise principalement par sa technologie ouverte. Conçu en évitant toute viola- tion de brevets, tout le monde peut l'utiliser sans payer de droits. Bien que cet aspect semble anodin, il pourrait avoir une incidence sur l'évolution de la technologie numérique, en particu- lier, son utilisation par les radiodiffu- seurs de service public.

Il convient de clarifier la diffĂ©rence entre « normes ouvertes » et « technologie ouverte », deux concepts prĂŞtant souvent Ă  confusion. Les radiodiffuseurs ont toujours privilĂ©giĂ© les normes ouvertes plutĂ´t que les technologies propriĂ©taires afin de bĂ©nĂ©ficier de l’interopĂ©rabilitĂ© et s’assurer ainsi un crĂ©neau sur un marchĂ© compĂ©titif.

Les normes ouvertes sont publiées et à la disposition de tous mais les développeurs et les utilisateurs sont en général redevables de royalties aux détenteurs des brevets intégrés à ces normes. Elles peuvent donc être proprié- taires en ce sens que la technologie est privée et que son utilisation est payante. En revanche, la technologie ouverte favorise l'universalité et peut être utilisée gratuitement.

Le succès croissant de la diffusion de contenus vidéo via Internet impose de nouvelles exigences aux radiodiffuseurs de service public notamment à la BBC.

Contrairement à la radiodiffusion clas- sique, le coût de distribution sur le web augmente avec le nombre d'utilisateurs. Si cela est acceptable pour un service d'abonnés, elle va à l'encontre du modèle à revenu fixe du secteur de la radiodiffu- sion publique.

Une partie des coûts est due à la largeur de bande requise pour transmettre le contenu vidéo. La largeur peut être minimisée en utilisant un codec efficace et en adoptant des méthodes de distribution répartie telles que le peer-to- peer et le multicasting. Un autre aspect financier important est lié aux droits lorsqu'une technologie propriétaire est utilisée. Ces droits doivent être égale- ment acquittés dans le cas de normes ouvertes telles que MPEG. Bien que ces coûts soient gérables dans un premier temps, ils peuvent devenir prohibitifs si les radiodiffuseurs tentent de servir plusieurs millions d'utilisateurs, ou que de nouveaux services sont déployés alors qu'ils n'étaient pas prévus dans les contrats de licence initiaux.

Il est par consĂ©quent difficile avec les technologies de codec classiques (y compris les normes ouvertes) d'intĂ©grer le modèle de diffusion Internet utilisĂ© par les radiodiffuseurs de service public : les droits associĂ©s Ă  ces codecs sont en gĂ©nĂ©ral dĂ©finis dans le cadre d’une formule commerciale sur abonnement. Il est donc nĂ©cessaire de disposer d’une « technologie ouverte » pouvant ĂŞtre utilisĂ©e librement, sans paiement de royalties et indĂ©pendamment du nombre d'utilisateurs ou des nouveaux types de services fournis.

La question de la technologie ouverte ne se limite pourtant pas à une simple réduction des coûts pour les radiodiffu- seurs. Un principe fondamental de la BBC est l'accès universel à tous ses services . En d'autres termes, la BBC a l'obligation de mettre gratuitement ses contenus à la disposition du public, quelle que soit la plate-forme, sans dispositifs de verrouillage propriétaires.

En outre, elle envisage de nouvelles tech- nologies permettant notamment de télé- charger la majeure partie de ses programmes pendant sept jours à compter de la première diffusion. Elle examinera ultérieurement les possibilités d'étendre cet accès au contenu de ses archives.

Le déverrouillage de l'intégralité du contenu à vocation publique de la BBC consistera à le mettre à la disposition du public, à l'endroit et au moment qu’il souhaite, sur toute une gamme de plates-formes telles que les réseaux large bande et peer-to-peer ainsi que les péri- phériques mobiles.

Contrairement à la technologie proprié- taire, la technologie ouverte facilite la diffusion libre de contenus ainsi que l'exploitation du numérique. Les plates- formes de lecture de contenus vidéo seront de plus en plus variées.

Les codecs propriétaires ne pourront vraisemblable- ment pas les prendre toutes en charge. Ceux basés sur des normes ouvertes telles que H.264 pourraient supporter de nombreuses plates-formes mais les prére- quis en matière de licence restent un problème.

Avec le numérique, dans un monde où la vidéo est diffusée locale- ment dans les foyers, partagée sur des réseaux peer-to-peer, téléchargée et visionnée à la demande, peut-être même montée et recodée par le consommateur, de nombreux codecs seront présents dans chaque logement. Dès lors, même les frais de licence les plus modiques commencent à s'additionner, entravant l'adoption de ces nouvelles technologies. Aspect peut-être encore plus important que les coûts, les difficultés liées à la cession des droits de licence.

Beaucoup de nouvelles plates-formes – telles que les dĂ©codeurs, les camĂ©ras vidĂ©o, les enregistreurs Ă  disque dur, les assistants personnels et un nombre croissant de PC – utilisent le système d'exploitation Ă  source ouverte Linux reposant sur une « technologie ouverte ».

Cette tendance s'explique en partie par l'absence de contraintes en matière de licence. Le développement et l'utilisation de codecs vidéo sous Linux ont cependant été entravés par l'obligation de paiement de royalties pour ces codecs. Le principe reposant sur la source ouverte est syno- nyme de distribution gratuite et, par définition, exempte de tout paiement.

Les principales technologies de lecture de contenus vidéo sous Linux, telles que MPlayer , revêtent un caractère juri- dique ambigu qui dissuade leur utilisa- tion sous ce système d'exploitation. Un codec vidéo reposant sur une techno- logie ouverte est dès lors essentiel.

Cette « ouverture » garantit la disponibi- litĂ© pĂ©renne de la technologie. Les radio- diffuseurs dĂ©pendent de la longĂ©vitĂ© de la technologie afin de pouvoir accĂ©der Ă  leurs archives.

Les consommateurs souhaitent également une prise en charge continue de la technologie pour pouvoir, eux aussi, consulter leurs propres collec- tions. De nombreux codecs propriétaires ont eu une longévité éphémère. Pour cette raison, nous lançons un logi- ciel standard totalement portable (écrit en C++) qui peut être mis en œuvre sur n'importe quelle plate-forme. Dirac sera disponible pendant de nombreuses années et peut être facilement réécrit pour de nouvelles plates-formes.

Pour se convaincre de l'efficacité de la technologie ouverte, il suffit simplement de prendre le réseau Internet. La majeure partie des technologies Internet repose sur le code ouvert. Par exemple, 70% des serveurs Web utilisent le logiciel Apache basé sur une technologie ouverte. La croissance effrénée du réseau Internet au cours des dix dernières années confirme l'efficacité de cette approche. Bref, lors de la mise au point du codec Dirac, nous avons simplement tenté de reprendre la méthode appliquée avec succès au déve- loppement du réseau Internet.

La philosophie Dirac

Le dĂ©veloppement de Dirac en tant que technologie ouverte exige une approche diffĂ©rente de la conception des codecs classiques. Les normes de compression vidĂ©o prĂ©cĂ©dentes ont Ă©tĂ© mises au point sous les auspices de l'UIT et du MPEG. En gĂ©nĂ©ral, de nouvelles normes sont dĂ©veloppĂ©es lors de confĂ©rences rĂ©unis- sant les parties intĂ©ressĂ©es des secteurs industriel et acadĂ©mique. Cette procĂ©- dure prĂ©sente l'avantage de rassembler la compĂ©tence de spĂ©cialistes d'horizons très divers. Elle peut aussi prĂ©senter certains inconvĂ©nients :

  • elle peut ĂŞtre lente et compliquĂ©e ;
  • les acteurs ont intĂ©rĂŞt Ă  intĂ©grer Ă  lanorme des technologies brevetĂ©es – mĂŞme si cette dĂ©marche accroĂ®t la complexitĂ© ;
  • la procĂ©dure aboutit Ă  un flux normalisĂ© et un codec de rĂ©fĂ©rence qui applique la norme mais s'avère inutilisable dans la pratique ;
  • la conception du codeur respecte des contraintes minimalistes.

La description de Dirac comprend deux parties : une spĂ©cification de compres- sion pour le flux binaire et le dĂ©codeur, et un logiciel pour les opĂ©rations de compression / dĂ©compression.

Contrairement aux normes MPEG, le logiciel n'a pas pour vocation unique de fournir un codage et un décodage de référence, mais il constitue un prototype pouvant être librement modifié, amélioré et déployé. La mise en œuvre du décodeur vise notamment un décodage rapide tout en garantissant la compatibilité d'une plate-forme logicielle à l'autre.

Dans le cas de Dirac, le logiciel a Ă©tĂ© dĂ©veloppĂ© en premier. Des travaux en cours actuellement doivent permettre la convergence de l'application et de la spĂ©cification. L'approche classique consiste Ă  dĂ©velopper une spĂ©cification et Ă  la mettre en Ĺ“uvre ensuite. La mĂ©thode choisie pour Dirac est plus rapide et plus souple. En accordant la prioritĂ© au dĂ©veloppement d'une applica- tion « monde rĂ©el », on s’efforce de garantir une spĂ©cification simple et facile Ă  mettre en Ĺ“uvre.

Comme le codec Dirac repose sur une technologie ouverte, il doit ĂŞtre facile Ă  comprendre et Ă  utiliser. Le concept de base se rĂ©sume en un mot : « simplicitĂ© ». De toute Ă©vidence, un codec moderne Ă  la pointe de la technologie ne peut ĂŞtre que d'une grande complexitĂ© mais nous avons tentĂ© de rĂ©duire cette dernière au maximum. Dirac devient dès lors plus simple Ă  comprendre, plus facile Ă  mettre en Ĺ“uvre et plus aisĂ© Ă  optimiser pour des performances en temps rĂ©el. Une documentation dĂ©taillĂ©e est fournie, certains documents Ă©tant dĂ©jĂ  disponibles sur notre site Web . La technologie Dirac

Dirac utilise un petit nombre d'outils choisis pour leurs performances subjec- tives. Bien que l’application de certaines de ses méthodes soient nouvelles dans le domaine de la compression vidéo, elles reposent sur des techniques existantes. A notre connaissance, Dirac n'enfreint aucun brevet propriétaire.

Architecture

Dirac est un codec vidéo hybride à compensation de mouvement classique, à l'instar des normes MPEG. Le mouve- ment de l'image est analysé et l'informa- tion résultante utilisée pour prédire une trame ultérieure. On applique une transformée à la prédiction et les coeffi- cients de cette transformée sont quanti- fiés et codés par entropie.

Le terme « hybride » dĂ©signe l’utilisa- tion d’une transformĂ©e et d’une compensation de mouvement. La compensation de mouvement vise Ă  supprimer la redondance temporelle tandis que la transformĂ©e sert Ă  Ă©liminer la redondance spatiale. Contrairement Ă  la plupart des codecs, Dirac a recours Ă  une transformĂ©e en ondelettes plutĂ´t qu'Ă  une transformĂ©e de blocs telle que la transformĂ©e en cosinus discrète (TCD).

Le codage entropique agence les bits de manière efficace dans le flux binaire. Dirac fait appel à un codage entropique plus souple et efficace appelé codage arithmétique, plutôt qu’aux habituels codes à longueur variable de Huffman.

Ondelettes

Les ondelettes se sont avérées plus effi- caces que les blocs pour la compression d'images fixes. Elles sont utilisées dans la norme de compression d'images fixes JPEG2000 .

Les artefacts à des débits binaires restreints ont tendance à être moins importants que ceux engen- drés par les transformées de blocs. Les ondelettes agissent d'un coup sur la totalité de l'image plutôt que sur de petites zones comme c'est le cas des transformées de blocs. Dirac bénéficie donc de la souplesse nécessaire pour fonctionner à des niveaux de résolution allant de la diffusion de contenus sur Internet à la TVHD.

La transformée en ondelettes est obtenue par un filtrage récurrent des signaux dans les zones basses et hautes fréquences. Dans le cas de signaux bidi- mensionnels, le filtrage intervient à la fois horizontalement et verticalement. À chaque étape, la sous-bande basses fréquences horizontale/verticale fait l'objet d'une nouvelle division entraînant une décomposition des fréquences loga- rithmiques en sous-bandes.

La figure ci-dessous montre, à gauche, l’image initiale, au milieu le résultat après une transformée en ondelettes de premier niveau et, à droite, la même photo après une transformée en onde- lettes de deuxième niveau. Sur la photo du milieu, la zone grisée représente zéro. Ainsi, bien que l’image trans- formée soit de la même taille que l'origi- nale, la majeure partie de l'information est concentrée dans le coin supérieur gauche des basses fréquences. Lorsque l'on y regarde de plus près, il est possible de voir les détails dans d'autres zones de la transformée mais, bien évidemment, à un niveau nettement inférieur. La procédure insère le gros de l'information dans une partie de la transformée (coin supérieur gauche des basses fréquences), ce qui permet d'obtenir la compression.

Un codage par transformée de deuxième niveau peut être appliqué pour comprimer davantage l'informa- tion. L’image de droite illustre une seconde transformée en ondelettes mais, cette fois, uniquement sur la partie supérieure gauche de la trans- formée du premier niveau. Bien que l'information soit plus compacte, il est possible de voir certains détails émer- geant à l'extérieur du coin supérieur gauche.

La même procédure peut être appliquée plusieurs fois successives pour parvenir à des niveaux supérieurs de transformée en ondelettes, mais comme les avantages diminuent, Dirac utilise uniquement une transformée en ondelettes à quatre niveaux.

Un codage par transformée de deuxième niveau peut être appliqué pour comprimer davantage l'informa- tion.

L’image de droite illustre une seconde transformée en ondelettes mais, cette fois, uniquement sur la partie supérieure gauche de la trans- formée du premier niveau. Bien que l'information soit plus compacte, il est possible de voir certains détails émer- geant à l'extérieur du coin supérieur gauche.

La même procédure peut être appliquée plusieurs fois successives pour parvenir à des niveaux supérieurs de transformée en ondelettes, mais comme les avantages diminuent, Dirac utilise uniquement une transformée en ondelettes à quatre niveaux.

La figure ci-dessus illustre la diffĂ©rence entre les transformĂ©es de blocs et les transformĂ©es en ondelettes. Les photos reprĂ©sentent des parties de trame prĂ©levĂ©es d'une image de dĂ©part, après compression avec Dirac et MPEG-2. Le dĂ©bit binaire initial de 160 Mbit/s a Ă©tĂ© compressĂ© Ă  1 Mbit/s avec les deux systèmes de compression. Le dĂ©bit de donnĂ©es a donc Ă©tĂ© rĂ©duit d'un facteur 160 ! Des artefacts de bloc sont claire- ment visibles sur l’image codĂ©e MPEG alors qu’ils sont inexistants sur la photo codĂ©e Dirac.

Au premier abord, l'image MPEG peut sembler plus nette mais il s'agit d'une illusion créée par le fait que l’on regarde une image fixe et non une vidéo. En réalité, les artefacts de bloc restent fixes tandis que l'image se déplace, entraînant un artefact parti- culièrement perturbant. Sur l'image en mouvement, la qualité de la compres- sion Dirac est de loin supérieure.

Codage entropique

Après la transformée en ondelettes, un codage entropique intervient pour mini- miser le nombre de bits utilisé. Le secret du codage entropique consiste à utiliser un nombre variable de bits pour les différentes valeurs. En principe, nous utilisons huit bits pour définir la lumi- nosité d'un pixel. Avec la transformée en ondelettes, nous constatons que nombre de ces valeurs sont approxima- tivement égales à zéro.

Si nous n'utilisons qu'un seul bit pour indiquer une valeur zéro, nous avons du coup besoin d'un nombre nettement inférieur de bits pour stocker la trans- formée. Cette technique ne fonctionne bien sûr qu'après une transformée en ondelettes car la photo de départ renferme peu de valeurs égales à zéro. Se reporter à pour de plus amples informations.

Dirac utilise pour le codage entropique une technique Ă©voluĂ©e, Ă  la fois souple et efficace, appelĂ©e « codage arithmĂ©tique ».

Les valeurs différentes de zéro dans les sous-bandes hautes fréquences de la transformée en ondelettes (et il y en a lorsqu'on y regarde de plus près) occupent souvent la même position sur l’image que celles dans les sous-bandes basses fréquences. Il existe donc des corrélations statistiques entre les sous-bandes. Dirac établit des modèles statistiques de ces corrélations et un codage arithmétique permet ensuite de les exploiter au mieux afin d'obtenir une meilleure compression.

L'information de mouvement estimée au niveau du codeur fait également l’objet d’une modélisation statistique et d’un codage arithmétique en vue d’être compressée en un nombre minimum de bits possibles. Ces données compressées sont intégrées à un flux binaire qui sera utilisé par le décodeur en tant qu'élément de la vidéo compressée.

Compensation de mouvement Dirac utilise la compensation de mouve- ment, à l'instar de nombreux autres systèmes, afin de parvenir à une bonne compression. Pour éviter les arte- facts de bloc caractéristiques d'autres codecs, il évalue le mouvement à l'aide de blocs chevauchants.

Dirac prend également en charge les estimations globales de mouvement permettant de spécifier les déplacements de la caméra (panoramiques et zooms) en quelques octets et de réduire ainsi le débit binaire. Lorsque les débits binaires sont faibles, il peut être utile de prédire simplement une trame en utilisant uniquement l'information de mouvement sans trans- mettre de coefficients d'ondelettes.

Une méthode encore plus radicale consiste à prédire qu'une trame sera semblable à la précédente. Ces techniques, prises en charge par Dirac, peuvent offrir des réductions substantielles du débit binaire lorsqu'une qualité moyenne est requise, comme dans le cas de la diffusion de contenus sur Internet.

Flux binaire

La syntaxe du flux binaire est tout à fait différente de celle du codage MPEG clas- sique.

La mise au point d'un nouveau codec a permis de dĂ©velopper une nouvelle syntaxe tout en exploitant et en incorporant certaines des meilleures fonctionnalitĂ©s de la syntaxe MPEG en proposant une structure plus simple, plus cohĂ©rente et plus facile Ă  utiliser. Nous sommes parvenus Ă  intĂ©grer de nouvelles fonctionnalitĂ©s inexistantes dans MPEG (ex. : numĂ©ros de trame uniques) et Ă  en supprimer d'autres devenues obsolètes (ex. : paramètres colorimĂ©triques de la TVHD). Par exemple, chaque trame d'un flux Dirac indique l'emplacement des trames suivante et prĂ©cĂ©dente dans le flux.

Cette fonctionnalité, inhabituelle dans les systèmes de compression, permet aux logiciels utilisant Dirac de naviguer beaucoup plus facilement dans le flux binaire. La simplicité de navigation dans le flux permet le montage de vidéo compressée. Les applications qui utili- sent des codecs plus anciens ne pren- nent pas en charge cette fonctionnalité, (par exemple MPEG-2), ils requièrent en conséquence des logiciels plus complexes et affichent des perfor- mances réduites.

Mise en Ĺ“uvre

Le logiciel Dirac est écrit en C++, un langage connu et à la portée de tous. Le C++ se prête parfaitement à ce genre d'application et permet à Dirac de fonc- tionner sous les systèmes d'exploitation les plus répandus. Dirac a été testé sous Windows, Linux, Apple et d'autres plates-formes.

Bien que le code soit rédigé en C++, une interface de programme d'applica- tion (API) a été conçue en C, langage classique utilisé à cette fin, pour permettre aux différents composants du logiciel de fonctionner harmonieuse- ment. L'API, qui est aussi simple que possible, assure une intégration directe de Dirac dans les lecteurs, les outils de traitement vidéo et les applications de diffusion de contenus.

Performances de Dirac

Dirac est conçu pour obtenir de bonnes performances subjectives grâce à quel- ques outils reposant sur des critères psychovisuels.

La modélisation psycho- visuelle intervient uniquement au niveau du codeur – il n'existe aucune matrice de quantification comme dans le cas des codecs MPEG-2 ou H.264 FRExt. Il sera dès lors possible de procéder à la mise en œuvre de Dirac avec plus de liberté et, par voie de conséquence, de disposer d’une marge de manœuvre plus grande pour améliorer ses performances.

Contrairement à la majorité des codecs, Dirac n'a pas été conçu pour optimiser le rapport signal de crête/bruit. La corrélation entre ce rapport et la qualité subjective des images compressées n’est pas bonne, notamment lorsque les débits binaires sont faibles. Dirac tente plutôt d'améliorer la qualité en se concentrant davantage sur des erreurs graves et en accordant moins d'impor- tance aux erreurs dans les hautes fréquences comme, par exemple, au niveau du contour des objets ou dans les zones texturées qui sont moins percepti- bles. Bien que la métrique de qualité de Dirac soit simple, elle affiche une effica- cité surprenante.

Étant donné que Dirac n'a pas été mis au point pour optimiser le rapport signal de crête/bruit, les mesures des performances sur cet aspect précis, par rapport à celles des autres codecs, ne sont pas représentatives. Un examen poussé indique qu'en dépit de la simpli- cité de ses outils, Dirac est très compa- rable aux autres codecs à la pointe de la technologie tels que H.264.

La relative simplicité de Dirac et la sobriété de son architecture sont syno- nymes de hautes performances. En principe, il devrait permettre des appli- cations plus simples et plus efficaces que ses concurrents, se prêtant parfai- tement à une utilisation sur des plates- formes mobiles telles que les télé- phones portables et les assistants numériques personnels. Ce type de mises en œuvre est cependant subor- donné à un effort d'optimisation consi- dérable auquel le projet s'attelle actuellement.

Début 2005, Dirac a permis la lecture de contenus vidéo jusqu’à 1 Mbit/s, en temps réel, sur un PC tournant sous Windows ou Linux. Il était ainsi possible d'obtenir une qualité proche de celle des radiodiffusions de qualité stan- dard, nettement suffisante pour la diffu- sion de contenus Internet.

La vitesse de lecture augmentera au fur et à mesure que nous optimiserons le logiciel. Des améliorations considérables de la vitesse de décodage sont possibles si nous exploitons la puissance de traitement des accélérateurs graphiques comme le font d'autres codecs.

Perspectives

Bien que Dirac ait démontré ses capa- cités à fournir, en temps réel, un contenu de bonne qualité sur toute une série de plates-formes, le codec est toujours en phase de développement. Nous espérons qu'il fera l'objet d'améliorations substantielles au cours des prochains mois. Nous pensons notamment à une amélioration de la spécification ainsi qu'à sa conver- gence avec le logiciel. Dirac est déjà pris en charge, à titre expérimental, par un certain nombre de lecteurs média, y compris Windows Media Player, et cette tendance se poursuivra.

Par la suite, nous espérons une normalisation de Dirac par un organisme officiel, même si la spécification et la technologie sont déjà à la disposition de tous. Alors que les codecs basés sur une trans- formée de blocs arrivent à la fin de leur cycle de développement, Dirac n'en est qu'à ses débuts. L'utilisation d’ondelettes et de niveaux variables de transformée montre que Dirac offre de très bons résultats sur tout un éventail de débits binaires et de tailles d'image. Le codage arithmétique est une garantie d'efficacité qui tient compte des propriétés statisti- ques du signal.

Les fonctionnalités telles que la configuration des mouvements globaux et les limiteurs de trames pren- nent en charge des images de qualité supérieure à de faibles débits binaires. Nous venons à peine de commencer à exploiter ces techniques déjà mises en oeuvre dans le flux binaire. Des amélio- rations substantielles des performances sont plus que probables.

Résumé

Dirac est un système de compression vidéo générique à la pointe de la techno- logie. Il garantit de bonnes performances en utilisant des techniques modernes telles que les transformées en ondelettes et le codage arithmétique. Il en est au début de son cycle de développement et possède un potentiel d’amélioration significatif. Il repose sur une technologie ouverte, à la disposition de tous, qui répond aux exigences des radiodiffu- seurs de service public et qui offre la possibilité aux consommateurs d'utiliser la technologie numérique.

Remerciements

Les auteurs saluent l'enthousiasme et le soutien de l'équipe Dirac de la BBC ainsi que de tous ceux qui ont contribué au développement de ce projet ouvert. Sans eux, Dirac n'aurait jamais vu le jour.

Tim Borer, ingénieur de recherche principal au département R&D de la BBC, est le chef du projet Dirac. Titulaire d’un doctorat en traitement vidéo (1992), il travaille depuis plus de 20 ans dans l’industrie de la radiodiffusion, à la BBC, Snell & Wilcox et Leitch. Ses domaines d’activités portent notamment sur les traitements vidéo, la compensation du mouvement, les conversions de normes vidéo et la compression aussi bien maté- riel que logiciel. Il a déposé pas moins d’une douzaine de brevets.

Ingénieur de recherche senior au département R&D de la BBC, Thomas Davies, est le principal développeur des algo- rithmes du projet Dirac. Après l’obtention d’un doctorat en mathématique et quelques années d’activités dans l’industrie des réseaux de commu- nication et satellite, il est recruté à la BBC en 2000. Outre ses travaux sur les systèmes de codage et les algorithmes de compression vidéo, son champ d’activité à la BBC porte également sur les caméras numériques radiocommandées, la modulation OFDM, le codage pour le contrôle d’erreur et l’évaluation de la qualité vidéo.

http://www.ebu.ch/en/technical/trev/trev_303-borer_fr.pdf?display=EN