Propriété intellectuelle et IA générative : Beaucoup de questions, peu de réponses

3 octobre 2023

2023 Insights sur la propriété intellectuelle

Pour célébrer le Mois des petites entreprises, Vector, en collaboration avec Smart & Biggar LLP, a développé une série explorant la relation dynamique entre l’IA et la propriété intellectuelle. Dans cette série, conçue pour soutenir les startups canadiennes et les professionnels de la recherche, Vector explore comment l’innovation en IA croise la propriété intellectuelle, en discutant des tendances, défis et stratégies qui façonnent ce paysage en constante évolution.

L’omniprésence soudaine de l’IA générative qui a accompagné l’introduction publique de ChatGPT a laissé de nombreux domaines en difficulté pour s’adapter, et le droit de la propriété intellectuelle (PI) ne fait pas exception. La première vague de problèmes de propriété intellectuelle associés à l’IA générative, tels que les conflits entourant les données d’entraînement et le droit d’auteur, progresse actuellement dans le système juridique.

L’IA en tant que créatrice

Traditionnellement, le but du droit d’auteur est de donner aux créateurs le pouvoir de contrôler la manière dont leurs œuvres sont utilisées, reproduites, distribuées et exposées, leur donnant ainsi une certaine capacité à protéger leur propriété intellectuelle et à tirer des bénéfices économiques de leurs créations.

L’une des premières questions entourant l’IA générative est le débat sur la question de savoir si une IA peut être considérée comme l’auteur ou le créateur d’une œuvre. Les premiers signes penchent vers une réponse négative, selon laquelle le droit d’auteur ne protège pas le contenu produit par l’IA générative; une décision historique a été rendue en faveur de cette position dans l’affaire américaine Thaler c. Perlmutter, indiquant que « l’attribution humaine est une exigence fondamentale du droit d’auteur. »

Cette affaire fait partie d’une série de cas d’essai juridiques pro bono visant à obtenir des droits de propriété intellectuelle pour des résultats générés par l’IA en l’absence d’un inventeur ou auteur humain traditionnel, initiés par le Dr Stephen Thaler, qu’il a baptisé le « Projet Inventeur Artificiel ». Le projet vise à promouvoir le dialogue sur l’impact social, économique et juridique des technologies de pointe telles que l’IA et à générer des orientations des parties prenantes sur la protection des résultats générés par l’IA. La demande de brevet du projet, qui visait à faire de DABUS (Dispositif pour l’autodémarrage autonome de la sentience unifiée) un inventeur de brevet, a été refusée par l’USPTO, qui a soutenu qu'« une machine ne qualifie pas d’inventeur selon les lois sur les brevets ». Presque tous les offices de brevets (à l’exception de l’Afrique du Sud, qui ne dispose pas d’un processus d’examen substantiel) ont suivi la décision de l’USPTO. 

Vous en voulez plus?

Dans le monde de l’IA et de l’apprentissage automatique, la propriété intellectuelle est un atout essentiel. Gardez une longueur d’avance sur la concurrence en faisant de la propriété intellectuelle une partie intégrante de votre stratégie d’affaires.

Données de formation protégées par le droit d’auteur

Un conflit potentiellement plus sérieux se prépare entre les détenteurs de droits d’auteur et les propriétaires de LLM, comme OpenAI, concernant l’utilisation de documents protégés par le droit d’auteur dans les données d’entraînement. Un exemple récent de résistance directe de la part des artistes est le lancement de l’outil web « Have I Been Trained? » par le collectif d’artistes Spawning. L’outil recherche dans le jeu de données d’entraînement LAION-5B pour trouver l’œuvre d’un utilisateur, qui a été utilisée pour entraîner Stable Diffusion et Imagen (Google). Spawning veut donner aux artistes des droits d’adhésion/désinscription pour l’inclusion dans les données d’entraînement. Le New York Times envisage également de prendre des mesures, arguant que « l’utilisation par OpenAI des articles du journal pour diffuser des descriptions d’événements d’actualité ne devrait pas être protégée par l’usage loyal » et que « cela risque de devenir une sorte de substitut à la couverture du journal. »

Des organisations comme OpenAI ont commencé à licencier commercialement des œuvres créées par leurs modèles, soulignant la nécessité de s’attaquer à la propriété du droit d’auteur. Des litiges juridiques peuvent survenir sur la propriété des droits d’auteur lorsque les œuvres générées par l’IA ressemblent à du contenu protégé, comme les poursuites en litige LLM intentées contre OpenAI, GitHub Copilot et Stable Diffusion.

Un autre piège potentiel de propriété intellectuelle pour le contenu généré par IA est l’utilisation non autorisée et/ou les schémas de licence mal exécutés. Ce type de problème est illustré par les litiges en cours de Getty contre Stability AI, les créateurs de Stable Diffusion. Un groupe d’artistes a également poursuivi Stability AI pour avoir utilisé des œuvres protégées par le droit d’auteur dans leurs données d’entraînement; OpenAI est notablement exclue de cette poursuite puisqu’ils n’ont pas publié d’informations sur leur jeu de données d’entraînement et ont un accord de licence avec Shutterstock

Un aspect qui complique ce problème est le risque potentiel d’entraîner des modèles d’IA à l’aide de bases de données pouvant contenir la propriété intellectuelle d’autrui. Par exemple, un modèle entraîné sur du code open source provenant de GitHub peut involontairement reproduire des portions de code protégé par le droit d’auteur, soulevant des inquiétudes concernant une contrefaçon ou un plagiat involontaire; c’est l’accusation portée à GitHub Copilot. Un autre exemple est l’accusation récente des auteurs de livres selon laquelle OpenAI aurait été entraînée à l’aide de « bibliothèques fantômes », des sites web qui hébergent un dépôt de livres et publications piratés. 

Extraction de données

Les tribunaux américains ont statué que le scraping de données accessibles au public est légal dans l’affaire hiQ Labs c. LinkedIn. Cependant, une décision ultérieure a conclu que hiQ Labs avait violé l’entente utilisateur de LinkedIn, ce qui a mené à un règlement entre les parties. Cela démontre que, bien que le scraping de données soit légal, il est sage de s’assurer que la source des données n’est protégée par aucun accord ou protection de la propriété intellectuelle. 

Conclusion

Le paysage juridique actuel entourant la propriété intellectuelle et l’IA générative est flou et fluctuant. L’indication actuelle est que l’IA ne peut pas être créatrice à la fois dans le droit d’auteur et les brevets. Il n’est pas encore clair quels droits accorderont les titulaires de droits d’auteur concernant l’utilisation de leur travail dans les ensembles de données d’entraînement. Pour éviter les problèmes liés à la propriété intellectuelle, il est recommandé d’essayer d’établir des contrats régissant toute donnée d’entraînement utilisée dans le développement de l’IA, soit par une entente de licence, soit par la propriété.  

Découvrez d’autres articles de la série

Propriété de la propriété intellectuelle : Possédez-vous votre invention?

Deux femmes tapant du code sur un ordinateur

Recherche de brevets : comment savoir si vous avez vraiment inventé quelque chose

Un homme regarde un tableau blanc avec des formules rouges dessus

Protection des inventions liées à l’amélioration des données et aux nouvelles entrées et sorties

Un homme tenant une tablette pointe un écran de télévision avec des inscriptions blanches dessus

Breveter les modèles d’IA : éviter l’objection redoutée sur le sujet

Téléchargez notre livre blanc sur la propriété intellectuelle pour l’IA au Canada!

La propriété intellectuelle est un actif clé pour les affaires, surtout en IA et en apprentissage automatique. Pour obtenir un avantage concurrentiel, priorisez l’intégration de la propriété intellectuelle dans vos plans d’affaires, y compris les stratégies de commercialisation et de monétisation.

À lire aussi :

2026
Réflexions
Recherche
Recherche 2026

La nouvelle cartographie de l’invisible

Logo vectoriel
2025
Réflexions

Une nouvelle étude révèle l’impact économique de 100 milliards de dollars de l’IA à travers le Canada, avec l’Ontario en tête

2025
Réflexions
Partenariat
Histoires de réussite

Pourquoi le partenariat du leader bancaire en IA CIBC avec le Vector Institute continue de croître