Jusqu’à présent, les entreprises technologiques ont pu alimenter gratuitement des outils d’IA comme ChatGPT ou Copilot avec les données de Stack Overflow. Mais cela devrait changer maintenant.
Jusqu’à présent, les développeurs d’outils d’IA comme ChatGPT ou Copilot pouvaient exploiter gratuitement les données de Stack Overflow pour former leurs algorithmes. Mais cela est sur le point de changer. Jusqu’à présent, dans la plupart des cas, les fournisseurs d’IA ont violé les conditions d’utilisation de la plateforme. Une compensation financière devrait bientôt tout arranger.
Formation à l’IA vs droits d’auteur
Reddit a soumis il y a quelques jours à peine. À partir du milieu de cette année, Stack Overflow souhaite également être récompensé si les fournisseurs d’outils d’IA tels que ChatGPT entraînent leurs algorithmes avec les données disponibles sur le portail Q&A pour les développeurs de logiciels.
Jusqu’à présent, de nombreux projets d’IA à grande échelle ont utilisé des données de formation librement accessibles sur Internet, entièrement gratuitement. Cependant, ces derniers mois, des doutes ont surgi à plusieurs reprises sur la légalité de cette approche. Car même si les données sont librement accessibles, cela ne signifie pas que leurs auteurs ont consenti à leur utilisation pour la formation à l’IA.
Cependant, une nouvelle tendance montre que ce n’est pas le cas à long terme. Les opérateurs de plateforme commencent désormais à facturer le traitement en masse de leurs données utilisateur. Cela s’applique également à Stack Overflow, qui veut protéger les 50 millions de questions et réponses de ses utilisateurs contre les abus d’outils d’IA tels que ChatGPT avec un paywall.
Stack Overflow veut une compensation pour la formation ChatGPT & Co.
L’utilisation de l’intelligence artificielle est généralement considérée comme l’une des plus grandes opportunités de l’industrie technologique. En plus des chatbots AI bien connus, le Copilot développé par Microsoft et GitHub, par exemple, s’appuie également sur de tels algorithmes. Son objectif est de soutenir les développeurs de logiciels dans leur travail en recommandant des modules de code.
Pour que cela fonctionne, cependant, les entreprises doivent former leur IA avec plusieurs millions d’ensembles de données. Plus la formation comprend de données, meilleures sont les suggestions et les recommandations de l’outil respectif.
Cependant, comme le rapporte Wired, selon le PDG de Stack Overflow, Prashanth Chandrasekar, il est important que les fournisseurs d’outils d’IA tels que ChatGPT ou les plateformes communautaires Copilot « compenser leurs apports”. Ce n’est qu’ainsi que ces derniers pourront continuer à attirer les utilisateurs et à fournir des informations de qualité.
Des outils comme ChatGPT violent les conditions d’utilisation de Stack Overflow
Jusqu’à présent, selon Chandrasekar, dans la grande majorité des cas, les développeurs d’IA ont violé les conditions d’utilisation de sa plate-forme. Parce que le contenu généré par l’utilisateur sur Stack Overflow relève d’une licence Creative Commons. Selon celle-ci, bien que chacun puisse utiliser librement les données, il doit toujours indiquer d’où elles proviennent.
Chandrasekar souligne que Stack Overflow ne veut être indemnisé que par les entreprises qui développent des outils d’IA à des fins commerciales importantes, telles que ChatGPT ou Copilot. L’accès gratuit aux données du portail est donc toujours garanti pour la plupart des organisations. Des informations concrètes sur les prix ne seront publiées que dans les semaines à venir.
Avant même, les modérateurs de la plateforme de développement critiquaient le chatbot IA développé par OpenAI. En décembre 2022, ils ont interdit de publier des réponses générées par ChatGPT sur Stack Overflow. Car le flot d’informations erronées qui en découle peut difficilement être traité de manière adéquate par l’équipe de modération.