AV1 (codec)

codec vidéo ouvert From Wikipedia, the free encyclopedia

AV1 est un codec vidéo ouvert et sans redevance[1] créé en 2018 et conçu pour la diffusion de flux vidéo sur Internet et réseaux IP[2] comme successeur de VP9.

Type MIME
video/AV1, video/webm; codecs="av01.*"Voir et modifier les données sur Wikidata
Développé par
Version initiale
Type de format
Faits en bref Type MIME, Développé par ...
AV1
Caractéristiques
Type MIME
video/AV1, video/webm; codecs="av01.*"Voir et modifier les données sur Wikidata
Développé par
Version initiale
Type de format
Basé sur
VP9, Daala, Thor (en)Voir et modifier les données sur Wikidata
Spécification
Site web
Fermer

Historique

En , Amazon, Cisco, Google, Intel Corporation, Microsoft, Mozilla Foundation, et Netflix créent l'Alliance for Open Media dans le but de développer un format vidéo ouvert, en réponse au H.265/HEVC[3]. Plusieurs autres acteurs du web rejoignent l'alliance dont VideoLAN (qui édite VLC) et Facebook[4]. Le , AOMedia, l’Alliance for Open Media, annonce la publication officielle[5] de la spécification AV1 (AOMedia Video Codec)[6], en partie basée sur le codec Daala de la fondation Mozilla.

La fondation Mozilla et Bitmovin mettent en ligne fin une démo vidéo utilisant le codec AV1, accessible uniquement pour la version Nightly de Firefox[7].

En , les premières vidéos en AV1 commencent à être disponibles sur YouTube[8].

En , Intel et Netflix annoncent qu'ils travaillent sur le codec vidéo SVT-AV1 (pour Scalable Video Technology for AV1) afin de rendre le standard AV1 viable sur le plan commercial[9]. Le nouveau codec vidéo haute performance est disponible en open source et libre de droits pour les créateurs de contenu, les développeurs et les fournisseurs de services[10].

En , Vimeo annonce mettre à disposition ses premières vidéos en AV1[11]. En septembre de la même année, YouTube annonce utiliser le nouveau codec en version bêta pour certains contenus[12]. Puis en , Netflix utilise le codec pour les flux vidéos envoyés aux terminaux Android [13].

AV2

Le 15 septembre 2025, AOMedia a annoncé la sortie prochaine de son successeur nommé AV2 pour la fin 2025. Il vise à offrir de meilleures performances de compression, une prise en charge améliorée des applications de réalité augmentée, de réalité virtuelle et d'affichage multi-écrans, ainsi qu'une plage de qualité visuelle étendue[14].

Descriptif

Il peut atteindre un taux de compression supérieur de 30 à 40 %[15] en moyenne à VP9 et H.265/HEVC et supérieur de 50 % à H.264[16],[17], le codec vidéo est le plus répandu pour le streaming en 2019[10]. AV1 permet donc de diviser par deux l’utilisation de la bande passante par rapport au H.264 mais, en contrepartie, l'implémentation de référence (libaom) consomme nettement plus de ressources de calcul que VP9 et H.264, tant pour le codage que pour le décodage. Néanmoins, le développement de libaom a privilégié la correction et l’exhaustivité vis-à-vis du standard, au détriment de l’efficacité ; d’autres implémentations améliorent significativement les performances.

Ce codec vidéo est aussi une initiative dans la lutte des « géants du net » contre les groupements d'experts établissant des standards propriétaires[5], notamment le H.265/HEVC[18], développé par le MPEG, le Video Coding Experts Group (en) et l'UIT-T. Le problème vient de la complexité d'utiliser ou d'indiquer le support de ces standards propriétaires : nécessité de rejoindre des patent pool, risque de poursuites judiciaires… même si l'entreprise Velos Media émet des doutes sur la gratuité et la liberté d'usage d'AV1, affirmant que le codec VP9, également au format ouvert, utiliserait des technologies dont les brevets n'appartiennent pas à l'Alliance for Open Media[18].

Technique

AV1 est un codec vidéo hybride à base de blocs, hérité de VP9. Il y ajoute cependant de nombreuses innovations issues de Daala (Xiph.org) et Thor (Cisco), ou inédites dans un format grand public[19].

Découpage de l'image

Chaque image est tout d'abord découpée en gros blocs de tailles égales nommés « superblocks ». Ce sont des carrés pouvant faire 128×128 (4× plus grands que dans HEVC/VP9) ou 64×64 pixels. Ce choix est déterminé pour la totalité du fichier vidéo par l'encodeur selon la résolution, les appareils cibles, les contraintes de latence ou la vidéo en elle-même. Les superblocks de 128×128 sont par exemple plus adaptés à la 4K/8K, quand ceux de 64×64 seront plutôt utilisés pour les vidéos basse résolution de type 720p ou pour des applications temps réel[20].

Chaque superblock peut ensuite être divisé selon 10 modes prédéfinis. Le mode PARTITION_SPLIT est le seul à pouvoir être récursivement divisé, permettant d'atteindre de petits blocs allant jusqu'à 4×4 pixels au minimum[20].

Compression de l'image

Mode palette

Afin de s'adapter à la capture d'écrans ou de jeux vidéo composé plus souvent d'aplats de couleurs que de nuances subtiles, chaque bloc peut être décrit sous forme d'une palette de couleurs[20], facilitant la compression tout en limitant les artéfacts liés a des changement brusques de couleurs ou à des détails nets de 1 pixel (comme les lignes d'un tableur).

Prédiction spatiale (intra)

La prédiction spatiale, ou intra-prédiction, consiste à deviner les pixels d'un bloc en utilisant les informations disponibles autour. Cette prédiction utilise les pixels voisins déjà décodés se situant directement au-dessus et à gauche[21].

Ils peuvent alors être combinés en utilisant une interpolation bilinéaire entre pixels selon une direction donnée. VP9 offrait pour ce faire 8 angles. AV1 l'améliore en y ajoutant une variation fine sous la forme d'un delta de ±3 pas de 3°, permettant de choisir parmi un total de 56 directions. Cette prédiction angulaire n'est pas possible pour les blocs de 4×4 pixels[20].

Sur des zones sans texture directionnelle claire, d'autres modes de prédiction sont possibles, tels que DC_PRED qui moyenne les deux voisins, ou SMOOTH (ainsi que SMOOTH_V et SMOOTH_H) pour les dégradés[19].

Enfin, une implémentation du Chroma from Luma (CfL) issue de Daala offre une prédiction de la chrominance à partir de la luminance, exploitant leur corrélation dans les images naturelles : les zones claires ont souvent des couleurs similaires, un contour de luminance annonçant généralement aussi un contour de couleur[22].

Prédiction temporelle (inter)

La prédiction temporelle, ou inter-prédiction, consiste à utiliser les images précédentes et futures pour prédire le bloc courant.

Là où VP9 pouvait utiliser jusqu'à 3 images de référence, AV1 peut monter jusqu'à 7 et les combiner ensemble. Le système de « warped motion » permet ensuite de déformer tout ou partie de l'image selon 6 paramètres, permettant de simuler translation, rotation, zoom et cisaillement. Cette amélioration du système classique n'autorisant que la translation existait déjà dans MPEG-4 ASP (sous le nom de « Global Motion Compensation ») mais était jugée trop lente. AV1 le rend ici performant et donc utilisable en pratique[19].

Filtres

Après la reconstruction de l'image, différents filtres peuvent être appliqués pour corriger les défauts visibles inhérents à la compression, ou restaurer des détails perdus de manière volontaire ou non.

Filtre de déblocage

Présent dans les codecs vidéo depuis H.261, ce filtre permet d'atténuer les discontinuités visibles aux frontières des blocs, un artefact caractéristique de la compression par blocs. AV1 propose quatre niveaux de force, appliqués de manière adaptative selon les caractéristiques locales de l'image[23].

CDEF (Constrained Directional Enhancement Filter)

En plus de rendre les frontières des blocs visibles, la transformée DCT crée un effet de halos ou d'ondulations autour des contours nets (texte, lignes). Cet effet, que l'on nomme « ringing », est corrigé par ce filtre qui lisse l'image dans la direction du contour, mais prend aussi en compte un seuil permettant d'ignorer les pixels trop différents du pixel central[24].

C'est une combinaison du Constrained Low-Pass Filter de Thor (Cisco) et du Directional Deringing Filter de Daala (Mozilla), permettant un gain visuel significatif en présence de contours et de délimitations nettes[24].

Filtres de restauration

Après le déblocage et le CDEF, l'image peut encore présenter du flou résiduel dû à la compression. Deux filtres de restauration sont disponibles, et l'encodeur choisit pour chaque région de l'image (de 64×64 à 256×256 pixels) lequel appliquer, ou aucun. Le "filtre de Wiener" est un filtre linéaire dont les coefficients sont optimisés par l'encodeur et transmis dans le flux. Il est particulièrement efficace pour corriger un flou uniforme. Le '''Self-Guided Filter''' (filtre auto-guidé) est un filtre non linéaire qui adapte son comportement à la variance locale de l'image : il lisse les zones uniformes tout en préservant les contours et les détails. Il nécessite moins de paramètres à transmettre mais est plus coûteux en calcul[25].

Synthèse de grain de film

Une des innovations majeures d'AV1 est sa gestion du grain naturel des films et du bruit des capteurs électroniques. En effet, lorsque ce grain est naturellement présent et souhaitable sur un film, il est problématique pour deux raisons : il est d'abord difficile à encoder de par son aspect aléatoire et différent à chaque image (rendant les fichiers plus lourds), mais il est de plus mal restitué par la suite car lissé[26].

AV1 y remédie en analysant ce grain, en extrayant ses caractéristiques, puis en le supprimant de l'image, la rendant de ce fait bien plus facilement compressible. Le décodeur peut ensuite utiliser ces caractéristiques pour générer un grain synthétique équivalent et l'ajouter à l'image reconstruite[26].

Cette méthode n'est donc pas adaptée à l'archivage, car ce grain statistiquement similaire n'est pas identique à l'original, mais offre un gain considérable lorsqu'elle est appliquée. Netflix annonce une réduction moyenne de débit de 36 % sur les contenus ≥1080p avec grain visible[27].

Adoption

L'AV1 promet une prise en charge dès 2019 par tous les navigateurs internet[28] et en 2020 par tous les processeurs[5]. En 2025, 94 % des navigateurs le supportent au moins partiellement[29].

Par les fournisseurs de contenu

YouTube met en ligne les premières vidéos lisibles avec AV1 en [30]. En 2020, la plateforme commence à diffuser des contenus 8K en AV1 sur les téléviseurs compatibles. Le support du live streaming AV1 via Enhanced RTMP est lancé en version beta en 2023[31].

Vimeo publie ses premières vidéos AV1 en [32] et contribue au développement de l'encodeur rav1e.

Netflix annonce en la première expérimentation d'AV1 sur son application mobile pour Android uniquement, se basant sur dav1d et FFmpeg[33]. L'annonce de la disponibilité du codec pour les téléviseurs compatibles et la Playstation 4 Pro est faite en novembre 2021[34]. Le streaming AV1 HDR est lancé en mars 2025. En décembre 2025, le codec représente environ 30 % du streaming mondial de la plateforme[35].

Twitch annonce en 2021 vouloir diffuser les premiers contenus AV1 vers 2022-2023, avec l'objectif de basculer entièrement vers AV1 en 2024-2025[36].

Facebook commence à utiliser AV1 en [37]. Meta déploie ensuite le codec pour Facebook et Instagram Reels à partir de novembre 2022, en s'appuyant sur un processeur vidéo dédié (MSVP) développé avec Broadcom. En septembre 2025, plus de 70 % du temps de visionnage vidéo sur les applications Meta utilise AV1[38].

Par les logiciels

Les navigateurs Microsoft Edge, Mozilla Firefox, Google Chrome et Opera Browser supportent AV1.

  • Edge à partir de la version 17, disponible en [39].
  • Chrome à partir de la version 70, disponible en [40].
  • Firefox à partir de sa version 65, disponible en [41].
  • Chrome pour Android à partir de la version 101
  • Opera Mobile à partir de la version 64
  • Android Browser à partir de la version 101
  • Samsung Internet à partir de la version 16

AV1 aurait dû être implémenté avec Safari 16.4, mais l'implémentation du codec a disparu des nouveautés au fil des versions bêta[42]. Le support a finalement été ajouté avec Safari 17 et macOS Sonoma en septembre 2023, limité aux appareils disposant du décodage matériel.

Microsoft annonce en le support de l'accélération matérielle dans Windows 10, en utilisant les puces Intel de technologie Tiger Lake, Nvidia de la série 30 ou AMD de la série Radeon RX 6000[43]. Ces puces sont cependant rares et récentes[44].

AV1 est supporté par Android à partir d'Android Q[45].

Implémentations logicielles

L'implémentation de référence est libaom, développée par l'Alliance for Open Media. Elle sert principalement à valider la spécification et offre une compression de haute qualité, mais avec des temps d'encodage très longs.

dav1d est un décodeur haute performance créé par les équipes de VideoLAN et FFmpeg, dévoilé en [46]. Il est optimisé pour une faible consommation mémoire et des performances élevées grâce à des optimisations SIMD (AVX-512, AVX2, SSSE3, ARM NEON). Firefox 67 est passé de libaom à dav1d en [47]. dav1d est devenu le décodeur AV1 par défaut dans FFmpeg.

GAV1 est une implémentation de Google, mais elle est 2 à 4 fois plus lente que dav1d 0.7 sur processeur ARM (utilisé principalement sur les plateformes mobiles)[48].

rav1e est un encodeur écrit en langage Rust développé par Xiph.org, décrit par ses auteurs comme le plus rapide et fiable des encodeurs AV1[49], suffisamment rapide pour les flux WebRTC temps réels[50].

SVT-AV1 (Scalable Video Technology for AV1) est un encodeur développé initialement par Intel et Netflix à partir de 2019[51]. Il a été adopté par l'AOMedia Software Implementation Working Group comme base du développement futur des encodeurs AV1. SVT-AV1 offre 14 presets (0 à 13), les presets 10 à 12 permettant l'encodage en temps réel. Netflix et YouTube l'utilisent en production[52].

Implémentations matérielles

GPU de bureau

La puce Dimensity de MediaTek est la première puce à implémenter un décodeur matériel de l'AV1 en [53].

Nvidia supporte le décodage AV1 à partir des GeForce RTX série 30 (architecture Ampere, )[54]. L'encodage et le décodage sont supportés à partir des RTX série 40 (architecture Ada Lovelace, ) avec un double encodeur capable d'encoder en 8K 10-bit à 60 fps[55].

AMD supporte le décodage AV1 à partir des Radeon RX 6000 (architecture RDNA 2, )[54]. L'encodage et le décodage sont supportés à partir des Radeon RX 7000 (architecture RDNA 3, )[56].

Intel supporte le décodage AV1 via Quick Sync Video à partir des processeurs Tiger Lake (11e génération Intel Core, 2020)[54]. Les GPU Intel Arc (architecture Alchemist, ) supportent l'encodage et le décodage matériel, avec un encodeur capable d'encoder en 8K 10-bit[57].

Apple Silicon

Les puces M3, M3 Pro et M3 Max () ainsi que l'A17 Pro () sont les premières puces Apple à intégrer le décodage matériel AV1[58]. Les puces M1 et M2 ne disposent pas de décodage matériel AV1 et doivent recourir au décodage logiciel.

SoC mobiles

MediaTek : le Dimensity 1000 () est le premier SoC mobile à intégrer un décodeur AV1 matériel. Les Dimensity 9000 et suivants supportent le décodage 8K30.

Qualcomm : le Snapdragon 8 Gen 2 () est le premier SoC Snapdragon à intégrer le décodage AV1 matériel, supportant le décodage 8K60 HDR[59]. Les générations suivantes (8 Gen 3, 8 Elite) conservent ce support.

En 2020, Qualcomm et Samsung ne proposaient pas encore de puce compatible AV1 et continuaient de soutenir des codecs propriétaires[60]. Cette situation a évolué avec l'adoption progressive d'AV1 par ces fabricants à partir de 2022, bien qu'ils se montrent encore réticents, Qualcomm ayant par exemple indiqué ne pas prévoir d'encodage AV1 matériel sur mobile, préférant se concentrer sur VVC[61].

Téléviseurs

Les téléviseurs Samsung 8K QLED (depuis 2020), LG OLED et NanoCell, Sony Bravia XR et TCL intègrent le décodage AV1 matériel, permettant la lecture des contenus YouTube et Netflix en 8K[58].

Licence et brevets logiciels

Le standard AV1 est open source. Les règles prévoient un retrait des droits d'utilisation pour toute entreprise qui attaquerait AV1 pour violation de brevet, ainsi que la mise en place d'un fonds de défense judiciaire[62].

En , l'entreprise luxembourgeoise Sisvel annonce la mise en place de deux patent pools pour les brevets d'AV1. Cependant, Sisvel ne donne aucune liste des brevets concernés[63].

Format de fichier image AVIF

Le codec AV1 peut également être utilisé pour coder des images à l'aide du format AVIF.

Références

Related Articles

Wikiwand AI