« Plus grand que ChatGPT » : l’IA de Google transforme le texte en musique
Rate this post

Le fait que l’intelligence artificielle puisse créer des images à partir de la saisie de texte n’est plus une nouveauté. Et l’IA est déjà utilisée dans l’industrie de la musique, la plupart des instruments individuels étant imités. qu’elle une morceau de musique entier conjure, cependant, est rare. Et MusicLM AI de Google le fait extrêmement bien.

Jusqu’à présent, il y a eu quelques tentatives pour sortir commandes vocales musique laisser développer. Même le développeur de ChatGPT, OpenAI, a développé sa propre approche avec son modèle « Jukebox ». Cependant, en raison des difficultés techniques et des données de formation limitées, la plupart des modèles sont incapables de produire des chansons avec des compositions complexes ou une bonne qualité sonore.

La création musicale presque fissurée

Cela pourrait changer avec MusikLM de Google. Le scientifique en intelligence artificielle Keunwoo Choi, qui étudie la musique générée par l’IA, qualifie même la technologie de « plus grande que ChatGPT ».

MusicLM a été créé avec un disque 280 000 heures de musique formés, permettant au programme de créer des pièces de « complexité significative ». Non seulement la composition, mais aussi la lecture sont de haute qualité.

Google propose des échantillons

Sur un site Web, Google donne quelques exemples de ce dont son IA est déjà capable. Ainsi, l’entrée est sortie « La bande originale principale d’un jeu d’arcade. C’est rapide et optimiste, avec un riff de guitare électrique accrocheur. La musique est répétitive et facile à retenir, mais avec des bruits inattendus comme des coups de cymbale ou des roulements de tambour. » un clip de 30 secondes qui vaut la peine d’être écouté.

Cependant, l’intelligence artificielle peut produire plus que de courtes chansons. C’est ainsi que le système est construit mélodies existantes construit pour être fredonné, chanté, sifflé ou joué avec un instrument. Des sujets tels que « opéra », « choeur » ou « jazz » peuvent également être saisis.

Music AI fait aussi des erreurs

Cependant, MusicML est pas parfait, Mais au contraire. La qualité de nombreuses productions laisse encore beaucoup à désirer, ce qui peut être attribué à la méthode de formation. De plus, le modèle ne peut pas gérer la parole. Au lieu de en chantant le logiciel produit principalement un charabia incompréhensible.

Les chercheurs sont également conscients que ces modèles musicaux ont souvent tendance à représenter leurs données d’entraînement exclusives 1:1. Selon l’article des employés de Google, ce n’était le cas que de 1 % des chansons testées.

Des questions juridiques toujours ouvertes

Cependant, cette valeur semble être trop élevée pour rendre MusicML accessible à un public plus large. « Nous reconnaissons le risque de détournement potentiel de contenu créatif lié à MusicML », indique le journal.

Le problème n’est pas seulement de savoir si les œuvres générées sont trop similaires à l’original, mais aussi dans quelle mesure les originaux peuvent être utilisés pour former de tels systèmes. Donc déjà en cours d’exécution procédure de droit d’auteur contre certains générateurs d’images, où les plaignants se sont plaints du mépris de la Droits de reproduction se disputer.

« Plus grand que ChatGPT » : l’IA de Google transforme le texte en musique


politique de réseau

Les générateurs d’IA peuvent-ils utiliser mes images pour s’entraîner ?

Cela pourrait également être une raison pour laquelle Google n’a pas encore mis ses IA à la disposition du grand public, mais ne fait que les développer davantage dans un environnement scientifique protégé.

C’est à des fins de recherche exploration de données, c’est-à-dire que la collecte et le stockage de données afin de former une IA, par exemple, sont largement autorisés. Il ne devient juridiquement intéressant que si un modèle économique doit être créé à partir de celui-ci.