Propriété intellectuelle et IA générative : beaucoup de questions, peu de réponses
3 octobre 2023
3 octobre 2023
Pour célébrer le Mois de la petite entreprise, Vector, en collaboration avec Smart & Biggar LLP, a développé une série explorant la relation dynamique entre l'IA et la propriété intellectuelle. Dans cette série, conçue pour aider à soutenir les startups canadiennes et les professionnels de la recherche, Vector se penche sur la façon dont l'innovation en matière d'IA croise la propriété intellectuelle, en discutant des tendances, des défis et des stratégies qui façonnent ce paysage en constante évolution.
L'omniprésence soudaine de l'IA générative, qui a accompagné l'introduction publique du ChatGPT, a laissé de nombreux domaines se démener pour s'adapter, et le droit de la propriété intellectuelle ne fait pas exception à la règle. La première vague de problèmes de propriété intellectuelle associés à l'IA générative, tels que les conflits autour des données d'apprentissage et des droits d'auteur, fait actuellement son chemin dans le système juridique.
Traditionnellement, l'objectif du droit d'auteur est de permettre aux créateurs de contrôler la manière dont leurs œuvres sont utilisées, reproduites, distribuées et affichées, en leur donnant la possibilité de protéger leur propriété intellectuelle et de tirer des avantages économiques de leurs créations.
L'une des premières questions entourant l'IA générative est celle de savoir si une IA peut être considérée comme l'auteur ou le créateur d'une œuvre. Les premières indications tendent vers une réponse négative, à savoir que le droit d'auteur ne protège pas le contenu produit par l'IA générative ; une décision historique a été rendue en faveur de cette position dans l'affaire américaine Thaler v. Perlmutter, indiquant que "la paternité humaine est une exigence fondamentale du droit d'auteur".
Cette affaire fait partie d'une série d'essais juridiques bénévoles visant à obtenir des droits de propriété intellectuelle sur des produits générés par l'IA en l'absence d'un inventeur ou d'un auteur humain traditionnel, à l'initiative de M. Stephen Thaler, qu'il a baptisé le "projet d'inventeur artificiel". Ce projet vise à promouvoir le dialogue sur l'impact social, économique et juridique des technologies d'avant-garde telles que l'IA et à fournir des orientations aux parties prenantes sur la protégeabilité des résultats générés par l'IA. La demande de brevet du projet, qui visait à faire de DABUS (Device for the Autonomous Bootstrapping of Unified Sentience) l'inventeur d'un brevet, a été rejetée par l'USPTO, qui a estimé qu'"une machine ne peut être considérée comme un inventeur en vertu de la législation sur les brevets". Presque tous les offices des brevets(à l'exception de l'Afrique du Sud, qui ne dispose pas d'une procédure d'examen substantielle) ont suivi la décision de l'USPTO.
Dans le monde de l'IA et de l'apprentissage automatique, la propriété intellectuelle est un atout essentiel. Gardez une longueur d'avance sur la concurrence en faisant de la PI une partie intégrante de votre stratégie commerciale.
Un conflit potentiellement plus grave se prépare entre les détenteurs de droits d'auteur et les détenteurs de LLM, tels qu'OpenAI, concernant l'utilisation de matériel protégé par des droits d'auteur dans les données de formation. Le lancement de l'outil web "Have I Been Trained ?" par le collectif d'artistes Spawning est un exemple récent de réaction directe de la part des artistes. L'outil recherche l'œuvre d'art d'un utilisateur dans l'ensemble de données de formation LAION-5B, qui a été utilisé pour former Stable Diffusion et Imagen (Google). Spawning souhaite donner aux artistes le droit de participer ou de renoncer à l'inclusion de leurs œuvres dans les données d'apprentissage. Le New York Times envisage également de prendre des mesures, estimant que "l'utilisation par OpenAI des articles du journal pour produire des descriptions d'événements d'actualité ne devrait pas être protégée par l'usage loyal" et que "cela risque de devenir une sorte de remplacement de la couverture du journal".
Des organisations telles que l'OpenAI ont commencé à commercialiser des licences d'œuvres d'art créées par leurs modèles, soulignant ainsi la nécessité d'aborder la question de la propriété des droits d'auteur. Des litiges juridiques peuvent survenir pour déterminer qui détient les droits d'auteur lorsque les œuvres générées par l'IA ressemblent à du contenu protégé par le droit d'auteur, comme dans le cas des litiges LLM intentés contre OpenAI, GitHub Copilot et Stable Diffusion.
Un autre écueil potentiel en matière de propriété intellectuelle pour les contenus générés par l'IA est l'utilisation non autorisée et/ou les systèmes de licence mal exécutés. Ce type de problème est illustré par le litige en cours entre Getty et Stability AI, les créateurs de Stable Diffusion. Un groupe d'artistes a également poursuivi Stability AI pour avoir utilisé des œuvres protégées par le droit d'auteur dans ses données d'apprentissage ; OpenAI est notamment exclue de ce procès car elle n'a pas publié d'informations sur son ensemble de données d'apprentissage et a conclu un accord de licence avec Shutterstock.
Un aspect qui rend cette question encore plus complexe est le risque potentiel lié à l'entraînement de modèles d'IA à l'aide de bases de données susceptibles de contenir des éléments de propriété intellectuelle d'autrui. Par exemple, un modèle formé à partir de code open-source provenant de GitHub peut reproduire par inadvertance des parties de code protégé par le droit d'auteur, ce qui soulève des inquiétudes quant à la violation involontaire ou au plagiat ; c'est l'accusation portée à l'encontre de GitHub Copilot. Un autre exemple est l'accusation récente des auteurs de livres selon laquelle l'OpenAI a été entraînée en utilisant des "bibliothèques fantômes", des sites web qui hébergent un dépôt de livres et de publications piratés.
Dans l'affaire hiQ Labs contre LinkedIn, les tribunaux américains ont jugé que le scraping de données accessibles au public était légal. Toutefois, un jugement ultérieur a établi que hiQ Labs avait violé l'accord d'utilisation de LinkedIn, ce qui a donné lieu à un règlement entre les parties. Cela montre que, même si la récupération de données est légale, il est sage de s'assurer que la source des données n'est pas protégée par un accord ou une protection de la propriété intellectuelle.
Le paysage juridique actuel entourant la propriété intellectuelle et l'IA générative est obscur et fluctuant. Selon les indications actuelles, l'IA ne peut pas être un créateur à la fois de droits d'auteur et de brevets. On ne sait pas encore quels droits seront accordés aux détenteurs de droits d'auteur en ce qui concerne l'utilisation de leur travail dans les ensembles de données de formation. Pour éviter les problèmes liés à la propriété intellectuelle, la meilleure pratique consiste à essayer d'établir des contrats régissant toutes les données d'entraînement utilisées dans le développement de l'IA, soit par le biais d'un accord de licence, soit par celui de la propriété.
La propriété intellectuelle est un atout commercial essentiel, en particulier dans le domaine de l'IA et de l'apprentissage automatique. Pour obtenir un avantage concurrentiel, donnez la priorité à l'intégration de la PI dans vos plans d'affaires, y compris les stratégies de commercialisation et de monétisation.