La théorie de l’apprentissage automatique occupe le devant de la scène lors de l’atelier du Vector Institute

Par Arber Kacollja

Le récent atelier de théorie de l’apprentissage automatique du Vector Institute a réuni des chercheurs en théorie de l’apprentissage automatique pour présenter leurs dernières recherches, discuter de sujets de pointe et partager des perspectives sur les fondements théoriques de l’apprentissage automatique. L’événement, organisé par Shai Ben-David, membre du corps professoral de Vector, et Ruth Urner, affiliée au corps professoral de Vector, s’est tenu à l’Université de Waterloo en novembre.

Les théoriciens de l’apprentissage automatique jouent un rôle central en relevant les défis et en posant de nouvelles questions fondamentales dans le domaine. En approfondissant les aspects fondamentaux de l’apprentissage automatique, ils contribuent au développement de nouveaux concepts qui peuvent avoir un impact transformateur sur les méthodologies de résolution de problèmes. En fin de compte, leurs contributions peuvent provoquer un changement de paradigme dans la manière dont les enjeux complexes de l’IA sont abordés.

Les participants se sont réunis dans un amphithéâtre de l’Université de Waterloo pour l’atelier de théorie de l’apprentissage automatique de Vector en novembre.

Les participants se sont réunis à l’Université de Waterloo pour l’atelier de théorie de l’apprentissage automatique de Vector en novembre.

Au cours de l’atelier d’une journée entière, des membres du corps professoral, des membres affiliés du corps professoral, des boursiers postdoctoraux et des chercheurs de la communauté Vector au sens large ont entendu des conférences de certains des meilleurs théoriciens de l’apprentissage automatique qui couvraient un large éventail de sujets sur les fondements mathématiques de l’apprentissage automatique. Les participants ont également participé à des discussions de groupe interactives ainsi qu’à une séance d’affiches où des étudiants diplômés ont présenté leurs recherches.

Shai Ben-David, membre du corps professoral de Vector, utilise un micro pour accueillir les participants à l’atelier.

Shai Ben-David, membre du corps professoral de Vector, souhaite la bienvenue aux participants à l’atelier.

Ben-David a discuté des notions possibles de caractérisations et dimensions de la capacité d’apprentissage. Le théorème fondamental de l’apprentissage statistique affirme que la dimension de Vapnik–Chervonenkis (VC) caractérise l’apprentissabilité des classes pour la tâche de prédiction d’étiquettes binaires. Des caractérisations similaires peuvent-elles être fournies pour d’autres tâches d’apprentissage telles que la prédiction multi-classes, les distributions de probabilité d’apprentissage non supervisées et plus encore? Ben-David, qui est titulaire de la chaire CIFAR au Canada en IA et professeur à la David Cheriton School of Computer de l’Université de Waterloo, a également expliqué les résultats récents de son laboratoire à l’Université de Waterloo indiquant l’absence de telles dimensions pour l’apprentissage statistique général et pour l’apprentissage des classes de distributions de probabilité.

Au-delà des paradigmes classiques de statistique et d’informatique

Murat Erdogdu, membre de la faculté vectorielle et président canadien de l’IA au CIFAR, ainsi que les chercheurs de ce laboratoire étudient l’effet de l’optimisation basée sur le gradient sur l’apprentissage des caractéristiques dans les réseaux de neurones à deux couches. Dans sa présentation, Erdogdu, qui est aussi professeur adjoint au département d’informatique et au département des sciences statistiques de la Faculté des arts et des sciences de l’Université de Toronto, a examiné un contexte où le nombre d’échantillons est du même ordre que la dimension d’entrée et a montré que, lorsque les données d’entrée sont isotropes, la descente du gradient améliore toujours le modèle initial de caractéristiques aléatoires en termes de risque de prédiction, pour une certaine catégorie de cibles. En s’appuyant davantage sur l’observation pratique que les données contiennent souvent une structure supplémentaire, c’est-à-dire que la covariance d’entrée a un alignement non trivial avec la cible, les travaux du groupe de recherche prouvent que la classe de cibles apprenables peut être considérablement étendue, démontrant une séparation claire entre les méthodes de noyau et les réseaux neuronaux à deux couches dans ce régime.

Les réseaux de neurones sont devenus si vastes que leur comportement peut être bien approximé par des « réseaux de neurones infinis », obtenus en considérant la limite du nombre de neurones vers l’infini. Cependant, il existe de nombreuses limites infinies possibles que l’on peut prendre. Par exemple, une limite bien connue est la limite du « noyau tangent neuronal » (NTK), où la profondeur est fixe et la largeur de la couche va à l’infini.

Mihai Nica, membre affilié de la faculté vectorielle et professeur adjoint à l’Université de Guelph, a introduit une limite infinie alternative, la limite infinie de profondeur et de largeur, où la profondeur et la largeur sont simultanément dimensionnées à l’infini. Cela conduit à des distributions exotiques non gaussiennes très différentes du comportement de type NTK mais qui correspondent plus précisément à la sortie des réseaux de neurones finis.

Au cours de la dernière décennie, un corpus de riches prédictions a été fait sur les spectres des matrices empiriques de Hessos et d’information au cours de l’entraînement (via la descente du gradient stochastique) dans des réseaux surparamétrés. Aukosh Jagannath, professeur adjoint à l’Université de Waterloo, a présenté des travaux récents réalisés en collaboration avec Gérard Ben Arous, Reza Ghessari et Jiaoyang Huang, où ils établissent rigoureusement certaines de ces prédictions. La présentation s’est concentrée sur leurs résultats pour un analogue à haute dimension du problème XOR, montrant que la trajectoire de descente du gradient stochastique (SGD) s’aligne rapidement avec les espaces propres émergents des valeurs propres de bas rang des matrices de Hesse et gradient; cet alignement se produit par couche, l’espace propre des valeurs aberrantes de la couche finale évoluant au fil de l’entraînement et présentant un déficit de rang lorsque le SGD converge vers des classificateurs sous-optimaux.

Vers un système d’apprentissage automatique robuste et fiable

Sivan Sabato, membre du corps professoral de Vector et président IA du CIFAR au Canada, également professeur agrégé à l’Université McMaster, a discuté du potentiel et des défis liés à l’utilisation des explications comme entrée d’un algorithme d’apprentissage. L’objectif est que les systèmes d’apprentissage automatique puissent apprendre beaucoup plus rapidement grâce à l’expérience s’ils entendent aussi des explications d’un enseignant compétent, tout comme les gens le font.

Par exemple, lorsqu’on apprend à diagnostiquer automatiquement les patients, les gens utilisent généralement des données historiques sur les patients précédents et leurs diagnostics. Cependant, le processus pourrait être beaucoup plus efficace si le système d’apprentissage pouvait aussi demander aux médecins d’expliquer certains diagnostics. Autre exemple, les logiciels et sites web pourraient mieux se personnaliser pour des utilisateurs spécifiques, s’ils permettent aux utilisateurs d’expliquer leurs préférences.

Intégrer des explications dans le processus d’apprentissage nécessite de comprendre comment elles peuvent être utilisées et comment elles devraient être interprétées par l’algorithme. Peut-être que l’aspect le plus difficile est de faire en sorte que le système d’apprentissage prenne en compte le fait que les explications peuvent être utiles, mais peuvent aussi parfois être erronées. Un système d’apprentissage robuste doit utiliser les explications avec prudence, afin de pouvoir bénéficier de bonnes explications sans être trop sensible aux mauvaises explications. Cette présentation proposait des méthodes pour y parvenir.

Ruth Urner, affiliée à Vector Faculty, présente sa conférence « Modèles d’adversaires ».

Urner, également professeure agrégée à l’Université York, a centré sa conférence sur la manière dont les exigences de robustesse adversaire peuvent être adéquatement modélisées. Elle a examiné comment différentes hypothèses de modélisation peuvent mener à des conclusions radicalement différentes. Urner soutenait que nous devrions viser des hypothèses minimales sur la manière dont un adversaire pourrait agir, et a présenté des résultats récents sur diverses assouplissement de l’apprentissage avec le cadre standard de robustesse adversaire (ou stratégique).

Dans cette optique, l’apprentissage statistique repose traditionnellement sur la génération de données d’entraînement et de tests par le même processus, mais les instances peuvent (stratégiquement ou adversement) répondre à un prédicteur publié visant un résultat précis. De telles manipulations des données au moment du test peuvent entraîner des défaillances inattendues d’un modèle appris. Un grand nombre d’études de recherche, tant pratiques qu’théoriques, visent à atténuer les risques de sécurité qui en résultent en développant des méthodes robustes face aux perturbations adversaires.

Estimation statistique sous contraintes de confidentialité différentielles

Gautam Kamath, membre du corps professoral de Vector et président canadien de l’IA au CIFAR, s’est concentré sur les recherches de son groupe sur l’estimation statistique sous contraintes de confidentialité. L’estimation statistique concerne des tâches fondamentales comme comprendre les motifs sous-jacents à un ensemble de données, ou calculer certaines statistiques agrégées comme la moyenne. La question pertinente est de savoir comment faire cela sans divulguer des informations sensibles sur des points de données individuels dans l’ensemble de données. Kamath, qui est également professeur adjoint à la David R. Cheriton School of Computer Science de l’Université de Waterloo, a parlé d’une multitude de nouveaux enjeux qui surviennent dans le secteur privé et de la manière de les aborder, notamment les compromis liés au biais statistique, aux données à queues lourdes et aux priorités sur l’ensemble de données.

De plus, Hassan Ashtiani, affilié à Vector Faculty et également professeur adjoint à l’Université McMaster, a parlé de l’apprentissage privé des modèles de mélange gaussiens (GMM). Les GMM représentent une riche classe de distributions qui ont été utilisées pour modéliser divers phénomènes scientifiques, notamment dans les premiers travaux de Karl Pearson dans les années 1890 pour étudier les caractéristiques des crabes rivaux. Ces dernières années, un intérêt important a été suscité pour la conception d’algorithmes optimaux par échantillonnage et efficaces en calcul pour l’estimation des GMG.

Cependant, concevoir des méthodes différencieusement privées pour apprendre les GMM a été difficile. Fait intéressant, certaines de ces difficultés représentent des lacunes fondamentales dans notre compréhension de l’estimation statistique privée. Dans son exposé, Ashtiani a exposé certains de ces défis, ainsi que des approches génériques pour les résoudre. Un thème commun était d’utiliser les estimateurs non privés comme une boîte noire, de « stabiliser » les résultats des estimateurs non privés, puis d’agréger les résultats de manière différenciellement privée. Les résultats comprenaient la première réduction computationnellement efficace pour l’estimation de paramètres privés vers non privés pour les GMG, ainsi que le premier résultat d’apprentabilité pour les GMM dans le contexte d’estimation de densité.

Parmi les autres moments forts de l’événement, on compte la discussion de Yaoliang Yu, membre du corps professoral de Vector, sur l’empoisonnement des données, la compression de modèles et l’estimation de valeur (liée à Shapley), ainsi que la présentation de Daniel Roy, membre du corps professoral de Vector et codirecteur de recherche, sur l’application des infinitésimaux aux problèmes ouverts en théorie statistique de la décision.

Le travail des théoriciens de l’apprentissage va au-delà de la simple résolution de problèmes; elle sert de catalyseur pour une compréhension plus profonde des phénomènes émergents. En explorant les principes fondamentaux qui sous-tendent l’apprentissage automatique, les théoriciens de l’apprentissage fournissent des perspectives qui non seulement améliorent l’efficacité des systèmes existants, mais ouvrent aussi la voie au développement d’approches de pointe. Essentiellement, leurs contributions constituent la base de l’évolution continue de l’apprentissage automatique et de l’intelligence artificielle, façonnant le paysage de ces domaines dynamiques.

Vous souhaitez en savoir plus sur les initiatives de recherche actuelles de l’Institut Vector en théorie de l’apprentissage automatique? Cliquez ici pour la liste de lecture complète des conférences.

Au-delà des paradigmes classiques de statistique et d’informatique

Vers un système d’apprentissage automatique robuste et fiable

Estimation statistique sous contraintes de confidentialité différentielles

À lire aussi :

Hassan Ashtiani : Bâtir une IA fiable à partir de bases mathématiques

Les chercheurs en vecteurs font progresser l’apprentissage de représentation et la recherche en apprentissage profond à l’ICLR 2026

Session d’affiches remarquable 2026 : 60 projets de recherche façonnant l’avenir de l’IA

CRISPNAM-FG : Un modèle de survie profonde interprétable de Fine-Gray pour les risques concurrents dans les soins de santé

La nouvelle cartographie de l’invisible

Les chercheurs en vecteurs font avancer les frontières de l’IA avec 80 articles au NeurIPS 2025

Quand l’IA intelligente devient trop intelligente : Principaux enseignements de l’atelier 2025 sur la sécurité et la vie privée en apprentissage automatique de Vector

L’Institut Vector nomme 13 nouveaux membres du corps professoral, élargissant ainsi le leadership principal de la recherche à travers l’Ontario

Les chercheurs en vecteurs plongent dans l’apprentissage profond à l’ICLR 2025

Les chercheurs en vecteurs s’attaquent aux défis réels de l’IA lors de l’ICML 2025

Transformer le soutien en santé mentale des jeunes : le modèle de réponse aux crises propulsé par l’IA de FAIIR

Percée majeure en prévision météorologique par IA : comment l’innovation canadienne transforme la prévision climatique | Météo des Fourmiers

Explorer l’intelligence : le parcours de Kelsey Allen, membre du corps professoral de Vector, de la physique des particules à l’apprentissage automatique cognitif

Apprentissage par renforcement multi-agents dans le monde réel – Derniers développements et applications

Tirer parti des grands modèles de langage pour des revues systématiques plus efficaces en médecine et au-delà

Clonage de la pensée : enseigner à l’IA à penser comme des humains pour une meilleure prise de décision

Systèmes de recommandation : Là où le milieu universitaire rencontre l’industrie

Mon stage de chercheur invité à l’Institut Vector

Chercheurs en vecteurs présentant plus de 98 articles à NeurIPS 2024

Débloquer le potentiel de l’ajustement prompt dans l’apprentissage fédéré

Un nouvel ensemble de données multimodal aidera au développement de systèmes d’IA éthiques

Dévoiler la maladie d’Alzheimer : comment la parole et l’IA peuvent aider à détecter les maladies

Geoffrey hinton, cofondateur de Vector, remporte le prix Nobel de physique 2024

Autonomiser les voyageurs aériens : un chatbot pour les droits des passagers aériens canadiens

Les chercheurs de l’Institut Vector se réunissent de nouveau pour la deuxième édition de l’atelier sur la confidentialité et la sécurité sur l’apprentissage automatique

Le chercheur en vecteurs Wenhu Chen sur l’amélioration et l’étalonnage des modèles de fondation

Les chercheurs en vecteurs présentent des articles à ACL 2024

AtomGen : Rationaliser la modélisation atomistique grâce à l’intégration des ensembles de données et des benchmarks

Les chercheurs en vecteurs ont présenté plus de 50 articles à l’ICML 2024

Les chercheurs en vecteurs présentent plus d’une douzaine d’articles lors du CVPR 2024

L’atelier de vision par ordinateur du Vector Institute met en lumière les capacités actuelles du domaine et son potentiel futur

Le chercheur en vecteurs Gautam Kamath analyse les derniers développements en matière de robustesse et de confidentialité

Des experts de confiance et de sécurité en IA de renommée mondiale publient un article majeur sur la gestion des risques liés à l’IA dans la revue Science

Les protocoles standardisés sont essentiels au déploiement responsable des modèles de langage

Les inconnues connues : Le chercheur en vecteurs Geoff Pleiss creuse profondément dans l’incertitude pour rendre les modèles d’apprentissage automatique plus précis

Innover : le traitement du langage naturel titres Le dernier atelier de l’Institut Vector

Blog de recherche sur les vecteurs : Votre réseau de neurones est-il à risque? Le piège des optimiseurs à gradient adaptatif

Comment le chercheur vectoriel Xi utilise la confidentialité différentielle pour aider à garder les données privées

Blog de recherche sur les vecteurs : réseaux neuronaux structurés pour l’estimation de la densité et l’inférence causale

Blogue de recherche vectorielle : estimation de l’effet causal à l’aide de l’apprentissage automatique

Présentation de FlexModel : cadre révolutionnaire pour dévoiler les secrets des grands modèles d’IA générative

Neutraliser les biais en IA : le cadre UnBIAS du Vector Institute révolutionne l’analyse éthique des textes

Chercheurs en vecteurs présentant plus de 65 articles à NeurIPS 2023

IA pour la chimie et les matériaux : mélanger anciennes et nouvelles façons de penser

IA et santé publique : utilisation du traitement du langage naturel pour la gestion de bases de données cliniques

ICML 2023 : Développement d’un modèle de calcul adaptatif pour les tâches génératives multidimensionnelles

Blogue de recherche vectorielle : grands modèles de langage, incitations et PEFT

Dan Roy nommé codirecteur de Vector Research

Déverrouiller des approches alimentées par l’IA pour le traitement et la détection du cancer

La communauté Vector explore la recherche sur la confidentialité des données lors de l’atelier Machine Learning Privacy and Security

L’apprentissage automatique rencontre la mécanique quantique : Vector Workshop met en lumière des avancées révolutionnaires en informatique quantique

Plus de 20 articles de recherche sur les vecteurs acceptés au CVPR 2023

Recherche vectorielle présentée à l’ICLR 2023

Le Symposium de recherche sur l’IA met en lumière de nouvelles recherches sur les vecteurs

Les chercheurs en vecteurs remportent les plus grands honneurs à NeurIPS 2022

Le Canada peut être un leader en IA pour la science

Le chercheur en vecteurs Alán Aspuru-Guzik prononce la conférence Massey CIFAR

Apprentissage profond pour l’extraction d’empreintes de bâtiments dans l’imagerie aérienne

Graham Taylor nommé directeur de la recherche sur les vecteurs

Acceleration Consortium, Matter Lab et Vector Institute collaborent sur des logiciels pour alimenter les laboratoires de conduite autonome

La quête du nouveau membre du corps professoral de Vector, Jeff Clune, pour créer des systèmes d’IA ouverts

Blogue de recherche vectorielle : apprentissage par renforcement basé sur des modèles pondéré par gradient de valeurs

Un nouveau cadre d’IA aide à cartographier et gérer les espèces de moules envahissantes dans les lacs du Canada

Le rapport technique sur la vision par ordinateur détaille des perspectives issues d’un projet collaboratif entre l’industrie et le milieu académique

Les chercheurs en vecteurs ont reçu des prix lors de la Conférence internationale sur les représentations d’apprentissage (ICLR) 2022

Le Symposium de recherche rassemble la communauté Vector pour célébrer le travail des étudiants et des postdoctorants

Robustesse de l’apprentissage automatique : nouveaux défis et approches

L’équité dans l’apprentissage automatique : les principes de la gouvernance

Interprétabilité de l’apprentissage automatique : nouveaux défis et approches

Le hockey amateur bénéficie d’une expérience professionnelle de visionnage grâce à une startup de vision par ordinateur cofondée par un chercheur de Vector

Outil compatible avec l’IA qui identifie les variants de la COVID-19, co-développé par le chercheur de Vector Bo Wang

La technologie, y compris l’IA, joue de plus en plus un rôle clé dans notre chaîne alimentaire

Projecteur sur la santé à NeurIPS 2021

Chercheurs en vecteurs présentant plus de 50 articles à NeurIPS 2021

Les chercheurs Vector aident les institutions à assurer la confidentialité et la confidentialité lors du partage de modèles d’apprentissage automatique