Propriété intellectuelle et IA générative : Beaucoup de questions, peu de réponses
3 octobre 2023
3 octobre 2023
Pour célébrer le Mois des petites entreprises, Vector, en collaboration avec Smart & Biggar LLP, a développé une série explorant la relation dynamique entre l’IA et la propriété intellectuelle. Dans cette série, conçue pour soutenir les startups canadiennes et les professionnels de la recherche, Vector explore comment l’innovation en IA croise la propriété intellectuelle, en discutant des tendances, défis et stratégies qui façonnent ce paysage en constante évolution.
L’omniprésence soudaine de l’IA générative qui a accompagné l’introduction publique de ChatGPT a laissé de nombreux domaines en difficulté pour s’adapter, et le droit de la propriété intellectuelle (PI) ne fait pas exception. La première vague de problèmes de propriété intellectuelle associés à l’IA générative, tels que les conflits entourant les données d’entraînement et le droit d’auteur, progresse actuellement dans le système juridique.
Traditionnellement, le but du droit d’auteur est de donner aux créateurs le pouvoir de contrôler la manière dont leurs œuvres sont utilisées, reproduites, distribuées et exposées, leur donnant ainsi une certaine capacité à protéger leur propriété intellectuelle et à tirer des bénéfices économiques de leurs créations.
L’une des premières questions entourant l’IA générative est le débat sur la question de savoir si une IA peut être considérée comme l’auteur ou le créateur d’une œuvre. Les premiers signes penchent vers une réponse négative, selon laquelle le droit d’auteur ne protège pas le contenu produit par l’IA générative; une décision historique a été rendue en faveur de cette position dans l’affaire américaine Thaler c. Perlmutter, indiquant que « l’attribution humaine est une exigence fondamentale du droit d’auteur. »
Cette affaire fait partie d’une série de cas d’essai juridiques pro bono visant à obtenir des droits de propriété intellectuelle pour des résultats générés par l’IA en l’absence d’un inventeur ou auteur humain traditionnel, initiés par le Dr Stephen Thaler, qu’il a baptisé le « Projet Inventeur Artificiel ». Le projet vise à promouvoir le dialogue sur l’impact social, économique et juridique des technologies de pointe telles que l’IA et à générer des orientations des parties prenantes sur la protection des résultats générés par l’IA. La demande de brevet du projet, qui visait à faire de DABUS (Dispositif pour l’autodémarrage autonome de la sentience unifiée) un inventeur de brevet, a été refusée par l’USPTO, qui a soutenu qu'« une machine ne qualifie pas d’inventeur selon les lois sur les brevets ». Presque tous les offices de brevets (à l’exception de l’Afrique du Sud, qui ne dispose pas d’un processus d’examen substantiel) ont suivi la décision de l’USPTO.
Dans le monde de l’IA et de l’apprentissage automatique, la propriété intellectuelle est un atout essentiel. Gardez une longueur d’avance sur la concurrence en faisant de la propriété intellectuelle une partie intégrante de votre stratégie d’affaires.
Un conflit potentiellement plus sérieux se prépare entre les détenteurs de droits d’auteur et les propriétaires de LLM, comme OpenAI, concernant l’utilisation de documents protégés par le droit d’auteur dans les données d’entraînement. Un exemple récent de résistance directe de la part des artistes est le lancement de l’outil web « Have I Been Trained? » par le collectif d’artistes Spawning. L’outil recherche dans le jeu de données d’entraînement LAION-5B pour trouver l’œuvre d’un utilisateur, qui a été utilisée pour entraîner Stable Diffusion et Imagen (Google). Spawning veut donner aux artistes des droits d’adhésion/désinscription pour l’inclusion dans les données d’entraînement. Le New York Times envisage également de prendre des mesures, arguant que « l’utilisation par OpenAI des articles du journal pour diffuser des descriptions d’événements d’actualité ne devrait pas être protégée par l’usage loyal » et que « cela risque de devenir une sorte de substitut à la couverture du journal. »
Des organisations comme OpenAI ont commencé à licencier commercialement des œuvres créées par leurs modèles, soulignant la nécessité de s’attaquer à la propriété du droit d’auteur. Des litiges juridiques peuvent survenir sur la propriété des droits d’auteur lorsque les œuvres générées par l’IA ressemblent à du contenu protégé, comme les poursuites en litige LLM intentées contre OpenAI, GitHub Copilot et Stable Diffusion.
Un autre piège potentiel de propriété intellectuelle pour le contenu généré par IA est l’utilisation non autorisée et/ou les schémas de licence mal exécutés. Ce type de problème est illustré par les litiges en cours de Getty contre Stability AI, les créateurs de Stable Diffusion. Un groupe d’artistes a également poursuivi Stability AI pour avoir utilisé des œuvres protégées par le droit d’auteur dans leurs données d’entraînement; OpenAI est notablement exclue de cette poursuite puisqu’ils n’ont pas publié d’informations sur leur jeu de données d’entraînement et ont un accord de licence avec Shutterstock.
Un aspect qui complique ce problème est le risque potentiel d’entraîner des modèles d’IA à l’aide de bases de données pouvant contenir la propriété intellectuelle d’autrui. Par exemple, un modèle entraîné sur du code open source provenant de GitHub peut involontairement reproduire des portions de code protégé par le droit d’auteur, soulevant des inquiétudes concernant une contrefaçon ou un plagiat involontaire; c’est l’accusation portée à GitHub Copilot. Un autre exemple est l’accusation récente des auteurs de livres selon laquelle OpenAI aurait été entraînée à l’aide de « bibliothèques fantômes », des sites web qui hébergent un dépôt de livres et publications piratés.
Les tribunaux américains ont statué que le scraping de données accessibles au public est légal dans l’affaire hiQ Labs c. LinkedIn. Cependant, une décision ultérieure a conclu que hiQ Labs avait violé l’entente utilisateur de LinkedIn, ce qui a mené à un règlement entre les parties. Cela démontre que, bien que le scraping de données soit légal, il est sage de s’assurer que la source des données n’est protégée par aucun accord ou protection de la propriété intellectuelle.
Le paysage juridique actuel entourant la propriété intellectuelle et l’IA générative est flou et fluctuant. L’indication actuelle est que l’IA ne peut pas être créatrice à la fois dans le droit d’auteur et les brevets. Il n’est pas encore clair quels droits accorderont les titulaires de droits d’auteur concernant l’utilisation de leur travail dans les ensembles de données d’entraînement. Pour éviter les problèmes liés à la propriété intellectuelle, il est recommandé d’essayer d’établir des contrats régissant toute donnée d’entraînement utilisée dans le développement de l’IA, soit par une entente de licence, soit par la propriété.
La propriété intellectuelle est un actif clé pour les affaires, surtout en IA et en apprentissage automatique. Pour obtenir un avantage concurrentiel, priorisez l’intégration de la propriété intellectuelle dans vos plans d’affaires, y compris les stratégies de commercialisation et de monétisation.