jeu. Déc 1st, 2022

Meta a présenté le nouveau codec audio EnCodec, dont on dit qu’il atteint 10 fois le taux de compression du MP3 grâce à l’intelligence artificielle.

Meta veut bousculer le marché des codecs audio et fait entrer EnCodec dans la course. Par rapport au format MP3 vieux d’environ 30 ans, le groupe promet un taux de compression 10 fois plus élevé. Pour y parvenir, l’intelligence artificielle joue un rôle crucial.

EnCodec : Le remplacement du MP3 se fait attendre depuis longtemps

Les techniques de compression deviennent de plus en plus importantes de nos jours. Qu’il s’agisse d’afficher des images et des vidéos ou de lire des fichiers audio. L’ensemble d’Internet se compose dans une large mesure de contenu multimédia. Leur compression conduit finalement à une économie énorme sur la quantité de données à transmettre. Et tandis que toutes les quelques années, un nouveau codec soi-disant plus efficace est lancé sur Internet pour les vidéos, un vieux familier est toujours répandu pour les enregistrements sonores : MP3.

Mais le groupe Meta veut changer cela. La société a introduit un nouveau codec audio basé sur l’intelligence artificielle (IA) appelé EnCodec. Cela devrait être beaucoup plus efficace que le processus MP3. Pas étonnant, puisqu’il a maintenant une trentaine d’années et qu’il a donc une barbe assez longue.

Compression 10x grâce au réseau de neurones

« Nous atteignons un taux de compression d’environ 10x par rapport au MP3 à 64kbps sans aucune perte de qualité‘ Meta est confiant. La société se vante également d’être la première à utiliser la technologie basée sur les réseaux neuronaux pour EnCodec afin de décoder l’audio stéréo échantillonné à 48 kHz (qualité CD).

Voir aussi  House of the Dragon supplante The Rings of Power via P2P

Avec ses visions futures de la réalité virtuelle (VR) et du métaverse, le groupe porte naturellement un intérêt particulièrement grand aux techniques de compression efficaces. En effet, les mondes virtuels dépendent de moins en moins des connexions Internet rapides, de sorte qu’en fin de compte, davantage de personnes peuvent participer.

« Bien que nos techniques ne couvrent pas encore l’espace vidéo, c’est le début d’une initiative en cours vers des avancées qui pourraient améliorer des expériences telles que la vidéoconférence, la diffusion de films et jouer avec des amis en réalité virtuelle. »

Méta

EnCodec brise les limites des codecs audio précédents

Comme le précise Meta dans son annonce, les codecs classiques, dont le MP3, sont «probablement à la limite de ce que l’on peut réaliser avec des moyens manuels, c’est pourquoi il est important d’explorer de nouvelles techniques.Et c’est là qu’entre en jeu l’IA que l’entreprise utilise pour EnCodec. Ceux-ci peuvent donc être utilisés pour détecter les changements dans le signal audio »,qui ne peut pas être perçu par les humains“.

Et le résultat est assez étonnant. Dans une courte séquence vidéo, Meta démontre la comparaison de son nouveau EnCodec avec les deux codecs audio EVS et OPUS, qui sont également considérés comme très efficaces. Ce dernier est également utilisé dans le logiciel de visioconférence Jitsi, par exemple. Avec un débit binaire de seulement 6 kbit/s, les différences sont clairement audibles.