Les chercheurs en vecteurs présentent des travaux sur un large éventail lors de la Conférence internationale sur l’apprentissage automatique (ICML) de cette année, qui se tiendra du 6 au 11 juillet 2026 à Séoul, en Corée du Sud. Avec 73 articles acceptés – la meilleure performance de Vector à l’ICML à ce jour – et 11 articles phares parmi eux, les membres du corps professoral de Vector, les affiliés du corps professoral de Vector, les boursiers postdoctoraux distingués de Vector et le personnel de Vector contribuent à certains des domaines de recherche en apprentissage automatique les plus actifs aujourd’hui.
Le portefeuille de recherche de Vector à l’ICML 2026 couvre l’apprentissage par renforcement et la post-formation pour le raisonnement avancé, l’IA générative et la génération vidéo, les systèmes multimodaux et en langage visionnel, les agents autonomes, ainsi que les travaux de planification et de base en optimisation et théorie de l’apprentissage automatique. Parallèlement à ces avancées techniques, plusieurs documents de position acceptés reflètent l’engagement de la communauté à façonner la manière dont l’IA est construite et gouvernée – abordant le déploiement responsable des systèmes agentiques, la durabilité environnementale, l’équité dans les décisions à enjeux élevés, et le bien-être à long terme des personnes qui utilisent l’IA. Les applications en découverte scientifique, notamment la génomique, la chimie quantique et la modélisation des matériaux, démontrent encore davantage l’étendue des recherches de Vector dans des domaines réels.
Vous trouverez ci-dessous 73 articles acceptés par des membres du corps professoral de Vector, des membres affiliés du corps professoral de Vector, des boursiers postdoctoraux distingués de Vector et du personnel de Vector.
Adalina : approximation linéaire adaptative pour la valeur de Shapley et au-delà
Weida Li, Yaoliang Yu (membre du corps professoral vectoriel), Bryan Kian Hsiang Low
Résumé
The Shapley value, and its broader family of semi-values, has received much attention in various attribution problems. A fundamental and long-standing challenge is their efficient approximation, since exact computation generally requires an exponential number of utility queries in the number of players $n$. To meet the challenges of large-scale applications, we explore the limits of efficiently approximating semi-values under a $\Theta(n)$ space constraint. Building upon a vector concentration inequality, we establish a theoretical framework that enables sharper query complexities for existing unbiased randomized algorithms. Within this framework, we systematically develop a linear-space algorithm that requires $O(\frac{n}{\epsilon^{2}}\log\frac{1}{\delta})$ utility queries to ensure $P(\\|\hat{\boldsymbol\phi}-\boldsymbol\phi\\|\geq\epsilon)\leq \delta$ for all commonly used semi-values. In particular, our framework naturally bridges OFA, unbiased kernelSHAP, SHAP-IQ and the regression-adjusted approach, and definitively characterizes when paired sampling is beneficial. Moreover, our algorithm allows explicit minimization of the mean squared error $\mathbb{E}[\\|\hat{\boldsymbol\phi}-\boldsymbol\phi\\|^{2}]$ for each specific utility function. Accordingly, we introduce the first adaptive, linear-time, linear-space randomized algorithm, Adalina, that theoretically achieves improved mean squared error. All of our theoretical findings are experimentally validated. Our code is available at https://github.com/watml/adalina.
Résumé
Ce travail étudie comment approximer efficacement la valeur de Shapley et ses extensions, qui sont des outils populaires pour mesurer les contributions de caractéristiques individuelles, de points de données ou de participants dans les systèmes coopératifs. Le calcul exact de ces valeurs est généralement extrêmement coûteux parce que le calcul requis croît exponentiellement avec le nombre de joueurs. Pour relever ce défi, nous développons un nouveau cadre théorique pour une approximation efficace en utilisant uniquement une mémoire qui évolue linéairement avec le nombre de joueurs. Notre analyse offre en outre de meilleures garanties sur le nombre d’évaluations des services publics nécessaires pour obtenir des estimations suffisamment précises. Sur la base de ce cadre, nous concevons un nouvel algorithme appelé Adalina, qui réduit de façon adaptative l’erreur d’approximation attendue pour chaque instance spécifique du problème. Adalina est le premier algorithme aléatoire à être simultanément adaptatif, en temps linéaire et en espace linéaire. Notre cadre unifie également plusieurs méthodes d’approximation existantes, incluant OFA, noyau SHAP sans biais, SHAP-IQ et les approches ajustées en régression, et précise quand les techniques d’échantillonnage jumelé sont utiles.
Tous les circuits mènent à Rome : repenser l’anisotropie fonctionnelle dans la découverte de circuits et de faisceaux pour les LLM
Xi Chen, Mingyu Jin, Jingcheng (Frank) Niu, Yutong Yin, Jinman Zhao, Bangwei Guo, Dimitris Metaxas, Zhaoran Wang, Yutao Yue, Gerald Penn (affilié de la faculté Vector)
Résumé
Dans cet article, nous présentons des preuves empiriques et théoriques contre une hypothèse centrale mais largement implicite dans la découverte de circuits et faisceaux (CSD), que nous appelons l’hypothèse de l’anisotropie fonctionnelle : l’idée que les fonctions dans les grands modèles de langage (LLM) sont localisées à un mécanisme interne unique ou presque unique. Nous montrons qu’une seule tâche LLM peut plutôt être supportée par plusieurs circuits ou faisceaux structurellement distincts, qui sont simultanément fidèles, clairsemés et complets. Pour découvrir systématiquement de tels mécanismes concurrents, nous introduisons la répulsion des faisceaux consciente du chevauchement, une méthode qui augmente l’objectif CSD avec une pénalité explicite sur le chevauchement structurel à travers plusieurs exécutions de découverte, permettant la découverte de circuits ou de faisceaux avec une forte performance de tâche mais une structure partagée minimale à travers une multitude de benchmarks CSD courants. Nous constatons que ce phénomène devient de plus en plus marqué à mesure que le nombre de faisceaux découverts augmente et persiste de manière robuste à travers les principales méthodes de CSD. Nous identifions en outre un faisceau ultra-clairsemé à trois arêtes et montrons qu’aucune de ses arêtes n’est individuellement indispensable, sapant même les notions affaiblies de composants canoniques ou essentiels. Pour expliquer ces résultats, nous proposons une hypothèse de circuit dense distributif et fournissons une analyse théorique démontrant que les explications non uniques et à faible chevauchement émergent naturellement de superpositions de haute dimension sous hypothèses légères. Ensemble, nos résultats suggèrent que les explications mécanistes dans les LLM sont intrinsèquement non canoniques et appellent à repenser la manière dont les résultats des CSD devraient être interprétés et évalués.
Résumé
Les grands modèles de langage sont souvent interprétés comme utilisant un « circuit » ou un « faisceau » interne spécifique pour accomplir une tâche. Notre article remet en question cette hypothèse. Nous montrons que la même tâche peut souvent être accomplie par de nombreux mécanismes internes très différents à l’intérieur d’un même modèle, même lorsque ces mécanismes se chevauchent à peine structurellement. Pour étudier cela de manière systématique, nous introduisons une méthode appelée Overlap-Aware Sheaf Repulsion (OASR) qui complète DiscoGP, qui recherche explicitement d’autres circuits ou faisceaux à faible chevauchement qui résolvent toujours bien la tâche. À travers plusieurs benchmarks, en exploitant des instabilités et des choix arbitraires dans les méthodes existantes de découverte de circuits, nous découvrons constamment de nombreuses explications concurrentes plutôt qu’une seule explication canonique. Nous identifions également un mécanisme extrêmement petit à trois arêtes pour une tâche standard de modèle de langage, mais nous montrons que même ses composants ne sont pas uniquement essentiels. Dans l’ensemble, nos résultats suggèrent que le calcul dans les grands modèles de langage est plus distribué et non unique que ce que les hypothèses actuelles d’interprétabilité mécaniste laissent entendre. Nous fournissons en outre un cadre théorique expliquant pourquoi plusieurs explications à faible chevauchement peuvent naturellement apparaître dans de grands modèles de langage.
TLDR : Les tâches LLM ne sont pas implémentées par un seul véritable « circuit » ou « faisceau » unique : de nombreux mécanismes distincts à faible chevauchement peuvent simultanément soutenir le même comportement.
L’attrait et la réalité du recyclage des LoRA avec la fusion adaptative
Haokun Liu, Gyung Hyun Je, Marco Ciccone (chercheur postdoctoral distingué Vector, Zhenlin Xu, Prasanth YSS), Colin Raffel (membre du corps professoral Vector)
Résumé
La disponibilité généralisée de modules LoRA affinés pour les modèles ouverts pré-entraînés a suscité un intérêt pour des méthodes capables de fusionner adaptativement les LoRA afin d’améliorer la performance. Ces méthodes incluent généralement une façon de sélectionner des LoRAs à partir d’un pool et d’ajuster les coefficients de fusion selon un ensemble de données spécifique à chaque tâche. Bien que les méthodes de fusion adaptative aient démontré des améliorations dans certains contextes, aucun travail antérieur n’a tenté de recycler les LoRAs trouvées « dans la nature » sur des dépôts de modèles comme le Hugging Face Hub. Pour combler cette lacune, nous envisageons le recyclage à partir d’un pool de près de 1 000 LoRA contribuées par les utilisateurs, entraînées à partir du modèle de langage Llama 3.1 8B-Instruct. Notre étude empirique comprend une gamme de méthodes de fusion adaptatives et non adaptatives en plus d’une nouvelle méthode conçue grâce à une vaste recherche dans le domaine de la conception méthodologique. Nous démontrons que les méthodes de fusion adaptative peuvent améliorer la performance par rapport au modèle de base, mais offrent un avantage limité par rapport à l’entraînement d’une nouvelle LoRA sur les mêmes données utilisées pour définir les coefficients de fusion. Nous constatons également non seulement que le choix spécifique des LoRA à fusionner a peu d’importance, mais que l’utilisation de LoRA avec des valeurs de paramètres initialisées aléatoirement donne des performances similaires. Pour mieux comprendre pourquoi les travaux passés ont été fructueux, nous confirmons que le transfert positif est effectivement possible lorsqu’il y a des LoRA très pertinentes dans le pool. Nous publions les points de contrôle modèles et le code en ligne à https://github.com/r-three/realistic-adaptive-merging.
Résumé
Les modèles modernes en grand langage sont généralement bons pour de nombreuses tâches, mais pas pour toutes; Ils peuvent être plus spécialisés pour de nouveaux domaines de tâches en utilisant de petits add-ons (comme des patchs de compétences). Des contributeurs individuels ont développé et partagé des milliers de ces correctifs, disponibles gratuitement pour un usage public. Fusionner ces correctifs de compétences accessibles publiquement en un seul modèle pour améliorer la spécialisation dans une tâche particulière s’est donc imposé comme une perspective passionnante. Nous testons la viabilité de cette idée en recyclant près de 1 000 correctifs de compétences que des contributeurs individuels ont téléchargés dans des dépôts publics.
Malheureusement, notre travail montre que fusionner ces correctifs n’est pas aussi efficace que d’entraîner un seul patch de compétence neuf sur les données d’une même tâche, ce qui est une alternative simple et directe. Nous constatons que la fusion de ces patchs n’est efficace que lorsque le pool est composé de patchs très pertinents, ce qui est irréaliste dans un contexte de recyclage pratique. Notre analyse suggère que les succès des travaux antérieurs avec la fusion des patchs de compétences ne proviennent peut-être pas de la combinaison d’expertise entre patchs, mais plutôt d’un effet secondaire qui stabilise accessoirement le comportement du modèle. Dans l’ensemble, notre constatation indique que recycler sans effort les patchs de compétences est plus complexe qu’il n’y paraît.
Attention avec mémoire routée pour un contrôle clairsemé apprenable
Qiuhao Zeng, Jerry Huang, Peng Lu, Ruiyi Fang, Gezheng Xu, Zihao Jing, Yufei Cui, Charles X. Ling, Gang Niu, Boyu Wang (affilié de la faculté Vector)
Résumé
Malgré les avancées en inférence à long contexte, les grands modèles de langage (LLM) demeurent fondamentalement limités par les mécanismes de mise en cache clé-valeur (KV) nécessaires à un calcul stable. Les techniques de gestion, telles que l’expulsion sélective des jetons et l’élagage, ont grandement atténué les problèmes survenus, mais éliminent souvent des informations potentiellement utiles pour gérer les besoins croissants en mémoire du cache. Dans cet article, nous nous appuyons sur ces approches pour proposer Attention with Routed Memory ARM, une nouvelle structure de mise en cache KV qui introduit un système de mémoire entièrement différentiable de taille fixe, organisé comme une structure de routage hiérarchique qui apprend à sélectionner les emplacements mémoire via Gumbel-Softmax et effectue des mises à jour sigmoïdes verrouillées qui combinent doucement des informations nouvelles et stockées, évitant ainsi l’expulsion brutale et réduisant ainsi la perte d’information. En combinant cela avec une politique de sélection dynamique de différentes quantités de mémoire lors de l’inférence, ARM adapte ses accès aux contextes simples et étend la récupération pour les entrées nécessitant un raisonnement plus profond, permettant une récupération plus évolutive et efficace sur des contextes courts et longs. Les résultats expérimentaux sur les benchmarks standards de bon sens et de raisonnement à long contexte démontrent qu’ARM obtient des performances et une efficacité supérieures comparées aux approches fixes de mise en cache KV, tout en restant efficients et évolutifs tant en mémoire qu’en latence de génération.
Résumé
L’inférence des grands modèles de langage est fondamentalement limitée par un cache de calculs antérieurs qui doit être maintenu tout au long de la génération. Cela pose problème lors de l’inférence à long contexte, c’est pourquoi des techniques ont été introduites par le passé pour éliminer directement des éléments à mesure que le processus continue de réduire ce fardeau.
Dans ce travail, nous introduisons _**ARM**_, une nouvelle structure de mise en cache façonnée comme une hiérarchie avec un nombre fixe d’emplacements mémoire dans lesquels l’information peut être routée et stockée. _**ARM**_ mélange graduellement l’information de façon douce, évitant les problèmes liés à l’élagage ou à l’expulsion directe de l’information individuelle. Nous augmentons en outre _**ARM**_ pour sélectionner dynamiquement différentes quantités d’information dans les mémoires selon le contexte d’entrée, permettant une récupération plus rapide et plus efficace sur différents types de problèmes, ce qui est confirmé par des validations empiriques.
TLDR : Nous introduisons un nouveau cache clé-valeur structuré comme un routeur hiérarchique de mémoires qui sélectionne dynamiquement des emplacements mémoire à utiliser dans différents contextes.
Mauvaise vision ou mauvaise pensée? Récompenser la perception pour le raisonnement multimodal
Article de mise en lumière
Haozhe Wang, Qixin Xu, Changpeng Wang, Taofeng Xue, Chong Peng, Wenhu Chen (membre du corps professoral de Vector), Fangzhen Lin
Résumé
Atteindre une synergie robuste perception-raisonnement est un objectif central pour les modèles vision-langage (VLM) avancés. Les avancées récentes ont poursuivi cet objectif via des conceptions architecturales ou des flux de travail agents. Cependant, ces approches sont souvent limitées par un raisonnement textuel statique ou compliquées par le fardeau important de calcul et d’ingénierie lié à la complexité des agents externes. Pire encore, cet investissement important ne génère pas de gains proportionnels, observant souvent un « effet de bascule » sur la perception et le raisonnement. Cela pousse à repenser fondamentalement le véritable goulot d’étranglement. Dans cet article, nous soutenons que la cause profonde de ce compromis est une ambiguïté dans l’attribution des crédits par modalité : lorsqu’un VLM échoue, est-ce dû à une perception erronée (« mauvaise vision ») ou à une logique défaillante (« mauvaise pensée »)? Pour résoudre cela, nous introduisons un cadre d’apprentissage par renforcement qui améliore la synergie perception-raisonnement en récompensant de façon fiable la fidélité de la perception. Nous décomposons explicitement le processus de génération en étapes entrelacées de perception et de raisonnement. Ce découplage permet une supervision ciblée sur la perception. De manière cruciale, nous introduisons la Vérification de la Perception (PV), utilisant un proxy de « raisonnement bandé » pour récompenser la fidélité perceptuelle indépendamment des résultats du raisonnement. De plus, pour étendre l’entraînement à des tâches VL libres, nous proposons la Vérification Verbale Structurée, qui remplace le jugement LLM à haute variance par une exécution algorithmique structurée. Ces techniques sont intégrées dans un mécanisme d’attribution de crédits conscient de la modalité (MoCA), qui dirige les récompenses vers la source spécifique de l’erreur — soit une mauvaise vision, soit une mauvaise pensée — permettant à un seul VLM d’obtenir des gains de performance simultanés sur un large spectre de tâches.
Résumé
Lorsqu’un modèle d’IA vision-langage se trompe sur une image, on ne sait pas s’il a vu la mauvaise chose ou s’il s’est trompé — un peu comme un médecin qui interprète mal une radiographie ou une bonne analyse. Cette ambiguïté « mauvaise vision vs. mauvaise pensée » signifie que les méthodes d’entraînement actuelles ne peuvent pas cibler la véritable source de l’erreur, ce qui cause un compromis frustrant : améliorer les habiletés visuelles dégrade le raisonnement, et vice versa.
Nous résolvons cela en divisant la réponse du modèle en étapes explicites de perception (ce qu’il voit) et des étapes de raisonnement (ce qu’il conclut). Pour évaluer la perception de façon indépendante, nous introduisons un test de « raisonneur à l’aveugle » : nous transmettons les descriptions visuelles du modèle — sans l’image — à une IA uniquement textuelle. S’il peut répondre correctement uniquement à partir de ces descriptions, la perception était exacte; Sinon, le modèle voyait mal. Nous combinons cela avec une nouvelle méthode de vérification structurée pour évaluer les réponses finales, créant un système d’attribution de crédit qui blâme précisément soit la « mauvaise vision », soit la « mauvaise pensée ».
Notre approche, le MoCA, est la première à briser le compromis perception-raisonnement. Un seul modèle à 7B paramètres améliore simultanément les tâches axées sur la perception, le raisonnement et la compréhension documentaire — dépassant même GPT-4o sur plusieurs benchmarks — sans le coût computationnel des systèmes agents à plusieurs tours.
Détection par boîte noire du texte généré par LLM à l’aide de la divergence généralisée de Jensen Shannon
Shuangyi Chen, Ashish Khisti (affilié à la faculté Vector)
Résumé
Nous étudions la détection par boîte noire du texte généré par machine sous contraintes pratiques : le modèle de notation (proxy LM) peut ne pas correspondre au modèle source inconnu, et la génération de contraste par entrée est coûteuse. Nous proposons SurpMark, un détecteur basé sur la référence qui résume un passage par la dynamique de ses surprises symboliques. SurpMark discrétise les surprises en états interprétables, estime une matrice de transition d’état pour le texte de test, et la note via un intervalle généralisé de Jensen–Shannon (GJS) entre les transitions de test et deux références fixes (humain vs. machine) construites une fois à partir de corpus existants. Théoriquement, nous dérivons des directives de conception sur la façon dont les compartiments de discrétisation devraient s’adapter aux données et fournirons une justification de principe pour notre statistique de test. Empiriquement, à travers plusieurs ensembles de données, modèles sources et scénarios, SurpMark correspond ou dépasse systématiquement les références, démontrant une forte robustesse à travers les domaines et générateurs; Nos expériences sur la sensibilité aux hyperparamètres présentent des tendances que nos résultats théoriques aident à expliquer.
Résumé
À mesure que le texte généré par l’IA devient de plus en plus courant, il est important de développer des moyens fiables de le distinguer du texte écrit par des humains. Cet article étudie la détection de texte généré par machine en examinant à quel point chaque jeton est prévisible ou surprenant sous un modèle de langage. Nous proposons SurpMark, une méthode qui compare les motifs de ces signaux de surprise au niveau des jetons entre le texte écrit par l’humain et celui généré par la machine. À travers plusieurs ensembles de données, générateurs et paramètres de robustesse, SurpMark fonctionne mieux que les méthodes de détection existantes.
TLDR : Nous proposons un détecteur basé sur la référence utilisant des transitions de Markov à l’état surprisal et un score GJS pour signaler le texte IA — rapide, précis, sans régénération.
Forcing de contexte : génération vidéo autorégressive cohérente avec contexte long
Shuo Chen, Cong Wei, Sun Sun, Tiancheng Shen, Ping Nie, Kai Zou, Ge Zhang, Ming-Hsuan Yang, Wenhu Chen (membre du corps professoral de Vector)
Résumé
Les approches récentes de génération de vidéos longues en temps réel utilisent généralement des stratégies de réglage en streaming, tentant d’entraîner un élève à long contexte à l’aide d’un enseignant à court contexte (sans mémoire). Dans ces cadres, l’élève effectue de longs déploiements mais reçoit la supervision d’un enseignant limité à de courtes fenêtres de 5 secondes. Cette disparité structurelle crée un décalage critique **élève-enseignant** : l’incapacité de l’enseignant à accéder à l’historique à long terme l’empêche de guider l’élève sur les dépendances temporelles globales, limitant ainsi ainsi la longueur du contexte de l’élève. Pour résoudre cela, nous proposons **Context Forcing**, un cadre novateur qui forme un élève à long contexte via un enseignant à long contexte. En veillant à ce que l’enseignant soit au courant de toute l’histoire des générations, nous éliminons le décalage de supervision, permettant une formation robuste de modèles capables d’assurer une cohérence à long terme. Pour rendre cela calculationnellement réalisable pour des durées extrêmes (par exemple, 2 minutes), nous introduisons un système de gestion du contexte qui transforme le contexte en croissance linéaire en une architecture **Mémoire Lente-Rapide**, réduisant considérablement la redondance visuelle. De nombreux résultats démontrent que notre méthode permet des durées de contexte efficaces dépassant 20 secondes—
6 à 10 fois plus longue que les méthodes de pointe comme LongLive et Infinite-RoPE. En tirant parti de ce contexte étendu, le Contexte Forcing conserve une cohérence supérieure sur de longues durées, dépassant les références de pointe sur diverses métriques d’évaluation vidéo longue.
Résumé
L’IA peut maintenant générer de la vidéo en temps réel, mais ces systèmes ont tendance à oublier ce qu’ils ont créé quelques instants plus tôt, donc sur un long clip, les visages, objets et arrière-plans dérivent lentement et cessent de correspondre. La cause réside dans la façon dont l’IA est entraînée : un modèle (l'« élève ») apprend à produire de longues vidéos en imitant un second modèle (le « professeur »), alors que l’enseignant ne peut regarder que quelques secondes à la fois et ne se souvient de rien avant cela. Un enseignant sans mémoire ne peut tout simplement pas apprendre à l’élève à rester constant à long terme.
On règle ça en donnant un souvenir à l’enseignant. Notre méthode, Context Forcing, permet à l’enseignant de voir toute la vidéo générée jusqu’à présent, afin de guider correctement l’élève pour qu’il reste cohérent dans le temps. Pour rendre cela pratique pour des vidéos allant jusqu’à deux minutes, nous ajoutons un système de mémoire qui conserve les moments récents en détail tout en comprimant les anciens et en supprimant les informations redondantes.
Le résultat est une vidéo qui reste cohérente sur des périodes beaucoup plus longues, environ six à dix fois plus longues que les meilleures méthodes existantes. Les personnages et les scènes tiennent ensemble du début à la fin.
TLDR : Formez un élève à long contexte par l’entremise d’un enseignant à long contexte.
Augmentation des données résiduelles contrefactuelles pour la régression
Hossein Mohebbi, Oliver Schulte, Ke Li, Pascal Poupart (membre du corps professoral de Vector)
Résumé
La modélisation basée sur les données dans les tâches de régression réelles souffre souvent d’échantillons d’entraînement limités, de coûts de collecte élevés et d’observations bruyantes. Inspirés par l’impact de l’augmentation des données sur la vision et le langage, nous proposons une nouvelle technique d’augmentation des données résiduelles contrafactuelles (CRDA) pour la régression tabulaire. Notre idée clé est qu’une fois qu’un régresseur a modélisé la composante systématique des données, le bruit restant peut être vu comme un résidu invariant qui reste stable sous de petites perturbations de caractéristiques soigneusement sélectionnées. Nous exploitons cette invariance résiduelle pour générer de nouveaux échantillons d’entraînement, mais réalistes, élargissant ainsi l’ensemble de données sans nécessiter de données réelles supplémentaires. Notre méthode est indépendante du modèle et s’applique facilement à divers types de régresseurs. Dans des expériences menées sur divers ensembles de données provenant de divers dépôts de références, en moyenne, la CRDA réduit la MSE d’un régresseur MLP de 22,9% et celle d’un régresseur XGBoost de 6,4%. Comparée aux générateurs de données et techniques d’augmentation de pointe existants, la CRDA surpasse constamment la réduction de la MSE. En ajoutant des variations contrafactuelles de principe aux données d’entraînement, notre méthode offre un remède simple et efficace pour les paramètres de régression à petits échantillons sujets au bruit.
Résumé
Beaucoup de prédictions quotidiennes — le prix d’une maison, le temps de récupération d’un patient, la production d’une usine — proviennent de modèles entraînés sur des données dans des tableaux. Dans de nombreux contextes réels, collecter suffisamment de données est lent, coûteux ou impossible, et les modèles entraînés avec trop peu d’exemples prédisent mal. Les chercheurs savent comment étirer de petits ensembles de données d’images ou de texte avec des ajustements réalistes comme des retournements ou des reformulations, mais il n’existait pas d’astuce aussi simple pour les tableaux de nombres.
Nous avons développé la CRDA, une méthode qui crée de nouveaux exemples d’entraînement crédibles. Après qu’un modèle ait capturé le motif général, chaque exemple réel diffère encore légèrement de ce que le modèle avait prédit, formant un écart ou une erreur inexpliquée propre à cet exemple. Le CRDA modifie quelques caractéristiques de l’exemple, recalcule le résultat prédit du modèle, puis réapplique ce même écart, produisant un nouvel exemple réaliste. Les vérifications intégrées ne conservent que les exemples synthétiques qui aident réellement, et laissent sinon le modèle inchangé.
Dans de nombreux ensembles de données, la CRDA a réduit considérablement les erreurs de prédiction, et de façon plus fiable que les méthodes existantes, surtout lorsque les données étaient rares. Il offre un moyen simple et sécuritaire d’obtenir davantage de données limitées dans des domaines comme la médecine, la finance et la fabrication, où la collecte de données coûte cher.
TLDR : Une nouvelle méthodologie d’augmentation des données qui améliore la performance du modèle de régression en générant des exemples d’entraînement synthétique éclairés via la perturbation des caractéristiques guidées par résiduel.
Coupled Cluster con MoLe : apprentissage des orbitales moléculaires pour les fonctions d’onde neuronales
Luca Anthony Thiede, Abdulrahman Aldossary, Andreas Burger, Jorge Campos-Gonzalez-Angulo, Alex Zook, Melisa Alkan, Kohei Nakaji, Jérôme F. Gonthier, Taylor Patti, Mohammad Vakili, Alán Aspuru-Guzik (membre du corps professoral de Vector)
Résumé
La théorie de la fonction de la densité (DFT) est la méthode la plus utilisée pour calculer les propriétés moléculaires; cependant, sa précision est souvent insuffisante pour les prédictions quantitatives. La théorie des grappes couplées (CC) est la méthode la plus efficace pour atteindre une précision au-delà de la DFT et prédire des propriétés qui correspondent étroitement à l’expérience. Elle est connue comme la « référence d’or » de la chimie quantique. Malheureusement, le coût computationnel élevé du CC limite son application généralisée. Dans ce travail, nous présentons le Molecular Orbital Learning Model (MoLe), un modèle équivariant d’apprentissage automatique qui prédit directement les objets mathématiques centraux de CC, les amplitudes d’excitation, à partir des orbitales moléculaires de Hartree-Fock en champ moyen comme entrées. Nous testons divers aspects de notre modèle et démontrons sa très grande efficacité des données ainsi que sa remarquable généralisation hors distribution vers des molécules plus grandes et des géométries hors équilibre, malgré notre entraînement uniquement sur de petites géométries d’équilibre. Enfin, nous examinons aussi sa capacité à réduire le nombre de cycles nécessaires pour converger les calculs de CC. Le MoLe peut poser les bases d’architectures d’apprentissage automatique basées sur des fonctions d’onde à haute précision afin d’accélérer la conception moléculaire et de compléter les approches de champs de force.
Résumé
Les meilleures méthodes de chimie quantique peuvent prédire le comportement moléculaire avec une grande précision, mais elles sont souvent trop coûteuses à utiliser de façon routinière. Les méthodes moins coûteuses sont plus rapides, mais elles peuvent manquer des détails importants pour concevoir des médicaments, des matériaux et des procédés chimiques.
- Nous utilisons des orbitales moléculaires : une description peu coûteuse de l’endroit où les électrons sont susceptibles de se trouver dans une molécule.
- MoLe apprend de ces orbitales pour prédire les grandeurs clés utilisées par la théorie des grappes couplées, l’une des méthodes les plus fiables mais coûteuses en chimie quantique.
- Parce que les orbitales moléculaires contiennent déjà des informations chimiques utiles, MoLe peut faire des prédictions précises même pour des molécules et des formes plus grandes qu’il n’a pas observées lors de l’entraînement; C’est le type de généralisation nécessaire à la conception moléculaire pratique.
En résumé : les orbitales moléculaires sont peu coûteuses, utiles et déjà disponibles, et apprendre d’elles peut rendre la prédiction moléculaire précise plus rapide et plus pratique!
TLDR : Prédiction des amplitudes des clusters couplés pour l’apprentissage efficace des propriétés moléculaires en données
Cross-view Lewis Weight Fusion : reprise exemplaire pour l’apprentissage incrémental de classe fédéré
Zhuang Qi, Yingpeng Tang, Lei Meng, Xiaoxiao Li (membre du corps professoral de Vector), Han Yu, Xiangxu Meng
Résumé
L’apprentissage incrémental de classes fédéré (FCIL) vise à accroître continuellement la capacité de reconnaissance d’un modèle dans un environnement distribué, lui permettant d’apprendre de nouvelles classes tout en conservant les connaissances de celles déjà vues. Exemplar replay s’est imposé comme une stratégie prometteuse grâce à sa simplicité et son efficacité. Les méthodes existantes sélectionnent soit des exemples basés sur la dynamique locale, soit construisent des espaces de caractéristiques globaux pour identifier des échantillons représentatifs. Cependant, ils font face à des défis inhérents pour trouver un équilibre entre efficacité et vie privée. Pour répondre à ce problème, cet article propose une méthode de fusion de Lewis à vue croisée pour la reprise exemplaire dans FCIL, appelée CLIF, qui fusionne des scores d’importance multi-vues pour guider la sélection représentative d’échantillons dans des contextes fédérés. Plus précisément, le CLIF se compose de deux modules principaux : 1) le module de fusion de poids de Lewis en vue croisée calcule et intègre les poids de Lewis à partir de plusieurs perspectives de caractéristiques afin d’obtenir une estimation cohérente de l’importance, assurant que les échantillons sélectionnés reflètent mieux la distribution globale des données et améliorant ainsi la représentativité du sous-ensemble de relecture. En s’appuyant sur cela, 2) le module d’entraînement pondéré basé sur la fréquence ajuste la contribution aux pertes de chaque échantillon selon sa fréquence de sélection entre les vues, ce qui met l’accent sur la contribution des échantillons critiques. De plus, nous fournissons une analyse théorique pour garantir la solidité et l’efficacité du CLIF. Des expériences approfondies sur trois ensembles de données démontrent que notre méthode améliore constamment les références de 1% à 6%, appuyant ainsi les affirmations ci-dessus.
Résumé
Les systèmes d’apprentissage automatique doivent souvent continuer à apprendre de nouvelles choses au fil du temps. Par exemple, un modèle de reconnaissance d’image peut d’abord apprendre à identifier plusieurs types d’objets, puis devoir en reconnaître de nouveaux. Cependant, lorsque le modèle apprend de nouvelles catégories, il peut oublier ce qu’il a appris auparavant. Ce problème devient plus difficile lorsque les données sont stockées chez de nombreux utilisateurs ou organisations et ne peuvent pas être collectées au même endroit en raison de préoccupations liées à la vie privée. Dans ce travail, nous étudions comment aider ces modèles à se souvenir des connaissances anciennes tout en apprenant de nouvelles classes. Notre idée est de laisser chaque participant conserver un petit ensemble utile d’exemples du passé. Au lieu de choisir ces exemples d’un seul point de vue, notre méthode examine les données sous plusieurs angles et sélectionne des exemples plus représentatifs des données globales. Cela accorde aussi plus d’attention pendant la formation aux exemples qui sont maintes fois identifiés comme importants. Des expériences sur trois ensembles de données montrent que notre méthode aide les modèles à mieux retenir les connaissances et améliore la performance par rapport aux approches existantes. Cela peut soutenir des systèmes d’apprentissage plus fiables dans des contextes sensibles à la vie privée où les données doivent rester distribuées.
Données synthétiques soigneusement sélectionnées n’ont pas à s’effondrer : une étude théorique du réentraînement génératif avec des préférences pluralistes
Ali Falahati, Mohammad Mohammadi Amiri, Kate Larson (affiliée à Vector Faculty), Lukasz Golab
Résumé
Le réentraînement récursif des modèles génératifs pose un défi critique de représentation : lorsque les sorties synthétiques sont sélectionnées selon un signal de récompense fixe, le modèle tend à s’effondrer sur un ensemble restreint de sorties qui sur-optimisent cet objectif, ce qui fait disparaître la diversité et ne parvient pas à représenter toute la gamme des préférences. Des travaux antérieurs ont suggéré qu’un tel effondrement est inévitable sans ajouter de données réelles à l’ensemble. Dans cet article, nous reprenons cette conclusion d’un point de vue d’alignement et montrons que l’effondrement peut être atténué par la curation basée sur plusieurs fonctions de récompense. Nous formalisons la dynamique de l’entraînement récursif sous des préférences hétérogènes et démontrons que, sous certaines conditions, le modèle converge vers une distribution stable qui alloue la masse de probabilité entre les régions concurrentes à haute récompense. La distribution limite préserve la diversité et satisfait de manière prouvée une solution de négociation de Nash pondérée, offrant une interprétation formelle de l’agrégation de valeur dans les boucles de réentraînement synthétique.
Résumé
Les modèles d’IA sont de plus en plus entraînés à partir de données (synthétiques) produites par des modèles d’IA antérieurs. Cela peut aider lorsque les données sont réelles (écrites ou étiquetées humaines), mais cela crée aussi un problème. Des travaux antérieurs ont montré que si chaque nouvelle ronde ne conserve que les sorties générées par le modèle précédent qui ne satisfont qu’une seule préférence, le modèle peut s’effondrer : ses sorties deviennent moins variées avec le temps, et à la limite, leur variance peut diminuer jusqu’à zéro.
Nous étudions une façon différente de choisir les données synthétiques. Au lieu d’utiliser une préférence fixe unique, nous laissons le processus de sélection alterner entre plusieurs préférences, comme différents goûts des utilisateurs ou des objectifs variés comme la qualité, la sécurité et la créativité. Ce petit changement a un effet important. Plutôt que de se concentrer sur un seul type étroit de réponse ou d’image, le modèle peut continuer à produire plusieurs types de résultats souhaitables.
Notre article présente les conditions mathématiques dans lesquelles cela se produit et teste l’idée dans des exemples synthétiques, la génération d’images et la génération de texte. Les résultats suggèrent que l’effondrement n’est pas une conséquence inévitable de l’entraînement sur des données synthétiques. Cela dépend de la façon dont ces données sont sélectionnées. Une sélection plus pluraliste peut préserver la diversité tout en améliorant le modèle.
Apprentissage informé par les dérivées des fonctionnelles d’échange-corrélation
Eike S. Eberhard, Luca Anthony Thiede, Abdulrahman Aldossary, Andreas Burger, Nicholas Gao, Vignesh Bhethanabotla, Alán Aspuru-Guzik (membre du corps professoral Vector), Stephan Günnemann
Résumé
Les fonctionnelles XC par apprentissage automatique (ML) visent à remplacer les approximations de la fonction de densité conçues par l’humain en apprenant directement à partir des données de référence, mais elles ne surpassent pas systématiquement les fonctionnelles hybrides traditionnelles à échelle $\mathcal{O}(N^4)$. Nous étudions donc un contexte de distillation hybride, où des fonctionnelles semi-locales ML-XC à échelle $\mathcal{O}(N^3)$ sont entraînées à reproduire des cibles B3LYP/def2-SVP. Nous introduisons la Derivative Informed XC-Loss (DI-Loss), une perte qui intègre des informations supplémentaires provenant de la fonctionnelle hybride de référence en supervisant les première et deuxième dérivées de l’énergie sur le Grassmannian des matrices de densité admissibles. Plutôt que de seulement faire correspondre le point fixe auto-cohérent, la perte DI aligne la réponse locale de premier et second ordre de la fonctionnelle apprise avec celle de la fonctionnelle cible. À travers quatre architectures évaluées, la DI Loss améliore constamment les principales métriques énergétiques. En moyenne uniforme entre les architectures, l’EMA d’énergie totale diminue de 66% par rapport à la supervision d’énergie et de densité seule. La métrique d’énergie du champ moyen sensible à la densité $E_\rho$ passe de 1,2 à 0,8 mEh en moyenne, tandis que les erreurs de dipôle et de densité $\mathcal{L}_2$ ne s’améliorent pas uniformément. Nous montrons également que les densités issues des fonctionnels distillés réduisent les itérations hybrides-fonctionnelles SCF jusqu’à 55%. Dans les calculs TDDFT en aval, la supervision hessienne améliore les prédictions à l’état excité, le XCdiff réduisant l’énergie d’excitation moyenne de l’EMA de 24 à 35% à travers les tailles moléculaires sur le QM40.
Résumé
Les simulations informatiques précises sont un outil important pour concevoir de nouvelles molécules et matériaux, avec des applications allant de la découverte de médicaments aux batteries, catalyseurs et produits chimiques durables. Ces simulations peuvent prédire des propriétés avant qu’un composé ne soit synthétisé en laboratoire, mais il existe un compromis persistant : les méthodes quantiques-chimiques les plus précises sont souvent trop coûteuses à utiliser à grande échelle, tandis que les méthodes moins coûteuses peuvent manquer des effets importants.
Ce travail utilise l’apprentissage automatique pour rendre les calculs chimiques de haute qualité moins coûteux. Nous nous concentrons sur la théorie de la fonction de la densité, l’une des approches les plus utilisées en chimie computationnelle. En théorie de la fonction de densité, la principale source d’erreur est une approximation appelée fonctionnelle d’échange-corrélation, qui détermine comment les électrons interagissent au-delà de l’électrostatique simple. Les fonctionnelles plus précises, comme les fonctionnelles hybrides, sont utiles mais coûteuses en calcul. Les fonctionnels moins chers sont plus rapides, mais généralement moins précis.
Notre idée est d’entraîner une fonctionnelle apprenée par machine pour imiter une fonctionnelle hybride plus coûteuse, afin qu’elle puisse fournir des prédictions similaires à un coût computationnel nettement inférieur. Au lieu d’enseigner seulement au modèle pour faire correspondre les énergies finales et les densités électroniques, nous lui montrons aussi comment le calcul de référence réagit localement lorsque la densité électronique est modifiée. En d’autres mots, le modèle apprend non seulement la bonne réponse, mais aussi la forme locale du paysage énergétique quantique autour de cette réponse.
Cette information dérivée supplémentaire rend la fonctionnelle apprise plus fiable. À travers plusieurs architectures de réseaux neuronaux, notre objectif d’entraînement informé par les dérivées améliore les principales métriques d’énergie comparé à la supervision standard de l’énergie et de la densité. En moyenne, il réduit les erreurs énergétiques totales de 66%. Les fonctionnelles apprises produisent aussi des densités électroniques qui peuvent être utilisées pour initialiser des calculs hybrides plus coûteux, réduisant le nombre d’itérations de solveur auto-cohérent jusqu’à 55%. Cela signifie que même lorsque le calcul coûteux est encore nécessaire, le modèle appris par machine peut aider à obtenir la réponse plus rapidement.
Nous testons également si les fonctionnelles apprises captent l’information pertinente au-delà des énergies de l’état fondamental. En théorie de la fonction de la densité dépendante du temps, utilisée pour prédire les propriétés optiques et d’état excité, la courbure de la fonctionnelle d’énergie est cruciale. En supervisant cette courbure pendant l’entraînement, notre méthode améliore les prédictions de l’état excité, réduisant les erreurs d’énergie d’excitation de 24 à 35% dans nos expériences.
Dans l’ensemble, ce travail montre comment l’apprentissage automatique peut distiller des modèles quantiques chimiques coûteux en modèles moins chers tout en préservant un comportement physique important. Cela pourrait rendre la modélisation moléculaire et des matériaux précise plus pratique pour des tâches de dépistage à grande échelle, comme la recherche de meilleurs candidats médicaments, catalyseurs ou matériaux fonctionnels.
TLDR : Nous entraînons les fonctionnelles XC en supervisant les gradients d’énergie sur la variété des matrices de densité et en distillant les fonctionnelles hybrides
Adaptation sans source guidée par densité discrétisée pour cibles continues
Article de mise en lumière
Gezheng Xu, Qi Chen, Qiuhao Zeng, Charles X. Ling, Boyu Wang (affiliés de la faculté Vector)
Résumé
L’adaptation de domaine sans source (SFDA) permet l’adaptation du modèle sous des décalages de distribution sans accès aux données sources, offrant une solution pratique pour les applications sensibles à la vie privée et ayant montré des progrès substantiels dans la classification. En revanche, la régression implique des variables cibles ordonnées et continues, posant des défis uniques pour l’adaptation de la représentation et le raffinement des pseudo-étiquettes dans le cadre de la SFDA. Pour combler cette lacune, nous proposons un algorithme novateur pour la prédiction continue de cibles en SFDA qui exploite des signaux de supervision informés par la densité discrétisée dépendants de l’instance pour affiner les pseudo-étiquettes dans un paradigme conscient de l’incertitude. En incorporant l’apprentissage auxiliaire de la distribution discrétisée, notre méthode favorise également des représentations de caractéristiques plus compactes et structurées, atténuant ainsi les difficultés inhérentes à l’adaptation des modèles de régression sous décalage de distribution. Nous démontrons théoriquement que la structure de densité résultante est robuste aux perturbations potentielles, soutenant un SFDA fiable pour la régression. Des expériences approfondies sur plusieurs références valident l’efficacité de l’approche proposée.
Résumé
Lorsqu’un modèle d’IA entraîné sur un ensemble de données est appliqué à un nouveau contexte différent, sa performance chute souvent, ce qu’on appelle un décalage de distribution. Dans de nombreuses applications réelles, comme la santé et la fabrication, la rééducation du modèle n’est pas une option, car les données d’entraînement originales peuvent être privées ou indisponibles, et les nouvelles données n’ont pas d’étiquette. Ce problème est particulièrement difficile pour les tâches qui prédisent des valeurs continues (comme l’âge d’un patient ou la durée de vie restante d’une machine), plutôt que de choisir parmi un ensemble fixe de catégories. Nous avons développé MERCI, une méthode qui aide les modèles à s’adapter à de nouveaux environnements sans accéder aux données originales ni à aucune étiquette. MERCI fonctionne en convertissant les prédictions incertaines du modèle en un histogramme — une simple représentation en forme de graphique à barres indiquant où la vraie valeur est susceptible de se situer — et utilise cela pour générer des indications mieux calibrées dont le modèle peut apprendre. Nos expériences sur diverses tâches démontrent que MERCI améliore constamment la précision des prédictions après adaptation, offrant une solution pratique et respectueuse de la vie privée pour déployer des modèles de régression dans des conditions réelles changeantes.
dnaHNet : Un modèle de base évolutif et hiérarchique pour l’apprentissage des séquences génomiques
Article de mise en lumière
Arnav Shah, Junzhe Li, Parsa Idehpour, Adibvafa Fallahpour, Brandon Wang, Sukjun Hwang, Bo Wang (membre du corps professoral vectoriel), Patrick Hsu, Hani Goodarzi, Albert Gu
Résumé
Les modèles de fondation génomique ont le potentiel de décoder la syntaxe de l’ADN, mais font face à un compromis fondamental. Les tokenizateurs de sous-mots standards fragmentent des motifs biologiquement significatifs tels que les codons et les éléments régulateurs, tandis que les modèles au niveau des nucléotides préservent la cohérence biologique mais engendrent des coûts computationnels prohibitifs pour de longs contextes. Nous introduisons dnaHNet, un modèle autorégressif de pointe sans tokeniseur qui segmente et modélise les séquences génomiques de bout en bout. Grâce à un mécanisme de segmentation dynamique différentiable, dnaHNet comprime les nucléotides bruts en jetons latents de manière adaptative, équilibrant la compression avec la précision prédictive. Pré-entraîné sur des génomes procaryotes, dnaHNet surpasse des architectures de premier plan comme StripedHyena2 en termes de mise à l’échelle et d’efficacité. Ce chunking récursif produit des réductions quadratiques FLOP, permettant une accélération d’inférence de $>3 \times$ sur les Transformers. Sur les tâches zéro injection, dnaHNet obtient une performance supérieure dans la prédiction de l’adaptation des variantes protéiques et de l’essentialité des gènes, tout en découvrant automatiquement des structures biologiques hiérarchiques sans supervision. Ces résultats établissent dnaHNet comme un cadre évolutif et interprétable pour la modélisation génomique de nouvelle génération.
Résumé
L’ADN contient des instructions qui aident à déterminer comment les organismes vivants croissent, fonctionnent et réagissent aux changements. Les modèles récents d’IA peuvent apprendre des motifs dans l’ADN, mais ils font face à un compromis difficile : lire l’ADN lettre par lettre préserve la signification biologique, mais c’est lent et coûteux, tandis que découper l’ADN en « mots » fixes peut briser des unités biologiques significatives.
Nous avons développé dnaHNet, un modèle d’IA qui apprend à regrouper les lettres d’ADN par lui-même au lieu de se fier à un vocabulaire fixe. Lorsqu’il lit les séquences d’ADN brut, dnaHNet comprime dynamiquement les lettres voisines en plus gros morceaux appris, ce qui lui permet de conserver une structure biologique importante tout en facilitant le traitement des longues séquences d’ADN.
Dans des expériences sur les génomes microbiens, dnaHNet était plus rapide et plus efficace que les modèles existants solides, tout en performant dans des tâches telles que la prédiction des effets des mutations protéiques et l’identification des gènes essentiels à la survie. Parce que le modèle apprend aussi des groupes biologiques significatifs sans qu’on lui dise explicitement quoi chercher, dnaHNet offre une voie évolutive et plus interprétable vers des systèmes d’IA qui peuvent aider les chercheurs à comprendre les génomes.
TLDR : Les architectures HNet évoluent mieux et performent mieux lors des évaluations biologiques en aval pertinentes que les modèles de fondation génomique SOTA.
Vérification publique efficace de l’apprentissage automatique privé via régularisation
Zoë R Bell, Anvith Thudi, Olive Franzese-McLaughlin, Nicolas Papernot (membre du corps professoral Vector), Shafi Goldwasser
Résumé
L’entraînement avec la confidentialité différentielle (DP) garantit aux membres du jeu de données qu’ils ne peuvent pas être identifiés par les utilisateurs du modèle publié. Cependant, ces fournisseurs de données, et en général le public, manquent de méthodes pour vérifier efficacement que les modèles entraînés sur leurs données respectent les garanties DP. La quantité de calcul nécessaire pour vérifier les garanties DP pour les algorithmes actuels évolue avec la quantité de calcul requise pour entraîner le modèle. Dans cet article, nous concevons le premier algorithme DP avec des compromis quasi optimaux entre la confidentialité et l’utilité, mais dont les garanties DP peuvent être vérifiées à moindre coût que l’entraînement. Nous nous concentrons sur l’optimisation convexe stochastique DP (DP-SCO), où les compromis optimaux entre vie privée et utilité sont connus. Ici, nous montrons que nous pouvons obtenir des compromis stricts entre la confidentialité et l’utilité en minimisant privément une série d’objectifs régularisés et en n’utilisant que la borne standard de composition DP. Surtout, cette méthode peut être vérifiée avec beaucoup moins de calcul qu’en entraînement. Cela conduit au premier algorithme DP-SCO connu avec une utilité de confidentialité quasi optimale, dont la vérification DP évolue mieux que le coût d’entraînement, réduisant significativement les coûts de vérification sur de grands ensembles de données.
Résumé
Les modèles d’apprentissage automatique peuvent révéler des informations sensibles sur les individus dont les données ont été entraînées. L’approche standard pour s’assurer qu’un modèle ne révèle pas d’informations sur ces individus est d’utiliser des algorithmes d’entraînement spécialement conçus, mais le public manque d’outils pour vérifier qu’un modèle a été entraîné avec un tel algorithme. Dans cet article, nous explorons comment nous pourrions concevoir ces algorithmes d’entraînement privés afin qu’il soit aussi facile pour le public de vérifier leur utilisation. Cela nous a menés à un algorithme qui conservait les garanties d’utilité optimale des algorithmes passés, mais réduisait drastiquement le temps nécessaire pour la vérification. Ce faisant, nous avons fait des progrès pour permettre au public de vérifier comment leurs informations sont utilisées par les entités dans les modèles d’entraînement.
TLDR : Nous fournissons le premier algorithme DP-SCO connu avec une utilité quasi optimale en matière de confidentialité, dont la vérification DP est plus évolutive que le coût d’entraînement
Intégration de la confiance : l’isotropie sémantique prédit la non-factualité dans la génération de texte long
Dhrupad Bhardwaj, Julia Kempe, Tim G. J. Rudner (entrant membre du corps professoral de Vector)
Résumé
Pour déployer de grands modèles de langage (LLM) dans des domaines d’application à enjeux élevés qui exigent des réponses substantiellement précises à des prompts ouverts, nous avons besoin de méthodes fiables et peu coûteuses en calcul qui évaluent la fiabilité des réponses longues générées par les LLM. Cependant, les approches existantes reposent souvent sur la vérification des faits affirmation par affirmation, qui est coûteuse en calcul et fragile dans les réponses longues aux questions ouvertes. Dans ce travail, nous introduisons l’isotropie sémantique — le degré d’uniformité entre les embeddings de texte normalisés sur la sphère unité — et l’utilisons pour évaluer la fiabilité des réponses longues générées par les LLM. Pour ce faire, nous générons plusieurs réponses de longue forme, les incorporons, et estimons le niveau d’isotropie sémantique de ces réponses comme la dispersion angulaire des plongements sur la sphère unité. Nous constatons qu’une isotropie sémantique plus élevée — c’est-à-dire une plus grande dispersion d’immersion — signale de manière fiable une cohérence factuelle plus faible entre les échantillons. Notre approche ne nécessite aucune donnée notée, aucun ajustement fin, aucune sélection d’hyperparamètres, et peut être utilisée avec des modèles d’embedding à poids ouvert ou fermé. Dans plusieurs domaines, notre méthode surpasse systématiquement les signaux de confiance agrégés existants en prédisant la non-factualité en utilisant seulement quelques échantillons, offrant un signal pratique et à faible coût en premier passe qui complète la vérification au niveau des réclamations dans les flux de travail LLM réels.
Résumé
Les grands modèles de langage sont de plus en plus utilisés pour produire des réponses longues et libres dans des contextes où la précision factuelle est essentielle. Cela soulève une question pratique : comment savoir si une telle réponse est fiable ou si le modèle est fabriqué? Les vérifications existantes les plus fiables sont coûteuses en calcul, décomposant chaque réponse en affirmations individuelles et vérifiant chaque affirmation par rapport à une référence fiable, ce qui peut nécessiter des centaines de requêtes modèles par réponse.
Nous proposons une alternative beaucoup moins chère. Nous invitons le modèle à répondre à la même question plusieurs fois et convertissons chaque réponse en une représentation numérique de sa signification via un modèle d’immersion séparé. Lorsque le modèle est sur un terrain solide, ces représentations s’alignent étroitement; Quand c’est incertain ou inventé, ils ont tendance à diverger. Le degré de divergence donne un score simple, et nous montrons qu’une plus grande divergence indique de façon fiable une précision factuelle plus faible.
L’approche ne nécessite aucune donnée étiquetée, aucun entraînement supplémentaire, aucun réglage manuel, et est compatible avec tout modèle standard de représentation textuelle. Nous introduisons également une procédure plus efficace pour évaluer la précision factuelle des réponses longues et publions un vaste ensemble de données annoté. Ensemble, ces contributions fournissent un signal à faible coût et évolutif pour signaler la sortie du modèle peu fiable avant le déploiement.
TLDR : Nous introduisons l’isotropie sémantique, une métrique inspirée de la géométrie pour évaluer la fiabilité des résultats de modèles de langage longs, et démontrons son efficacité et sa robustesse à travers divers modèles et contextes d’évaluation.
Exploitation des symétries d’espace poids pour approximer la courbure
Artem Artemev, Rui Xia, Benjamin M. Boyd, Youjing Yu, Felix Dangel (ancien boursier postdoctoral distingué Vector), Guillaume Hennequin, Alberto Bernacchia
Résumé
De nombreuses techniques d’apprentissage automatique reposent sur l’approximation de la courbure d’une fonction de perte, mais cela est notoirement difficile à réaliser à l’échelle des réseaux profonds modernes. Fait surprenant, aucun travail précédent n’a exploité les contraintes de courbure qui découlent des symétries bien connues de l’espace poids dans les paysages de pertes. En faisant la moyenne analytique sur des actions de groupe qui laissent la perte invariante, nous construisons des approximations hessiennes structurées à partir de gradients simples qui peuvent être estimées, stockées et inversées de manière tractable. Le choix du groupe de symétrie spécifié par l’utilisateur régit directement le compromis entre la précision d’approximation et le coût computationnel. De plus, notre cadre offre une perspective théorique unificatrice pour visualiser les méthodes existantes; en particulier, un choix spécifique du groupe de symétrie permet d’obtenir des estimations de courbure de type Shampoo/Muon. Nous validons notre méthode sur une gamme d’architectures réseau, et la déployons sur des benchmarks d’optimisation de second ordre, y compris un petit modèle de langage. Notre cadre d’estimation de courbure pourrait trouver des applications dans d’autres problèmes d’apprentissage automatique tels que l’estimation de l’incertitude, l’apprentissage continu, la compression/élagage, l’attribution des données d’entraînement, et plus encore.
Résumé
Entraîner les réseaux de neurones plus rapidement nécessite de connaître non seulement la direction de mise à jour des paramètres (le gradient), mais aussi la courbure du paysage de pertes. Calculer exactement cette courbure est irréalisable pour de grands modèles. Nous observons que les réseaux de neurones possèdent des symétries intégrées. Par exemple, échanger deux neurones et leurs connexions laisse le réseau inchangé. À partir d’un seul gradient, ces symétries nous permettent d’inférer analytiquement des gradients à de nombreuses configurations équivalentes, et nous montrons comment distiller cette information en une estimation de courbure. Des groupes de symétrie plus grands donnent des estimations moins coûteuses mais plus grossières; des groupes plus petits produisent des groupes plus riches. Nous prouvons qu’un choix de terrain intermédiaire spécifique produit des mises à jour mathématiquement équivalentes à celles de Shampoo et Muon, deux optimiseurs populaires, révélant un lien jusque-là inconnu entre ces méthodes et les symétries architecturales du réseau.
TLDR : Approximation de la courbure exploitant les symétries de l’espace des poids
Distillation équitable des ensembles de données via l’alignement inter-groupes des barycentres
Mohammad Hossein Moslemi, Nima Hosseini Dashtbayaz, Zhimin Mei, Boyu Wang (affilié à la faculté Vector), Bissan Ghaddar
Résumé
La distillation de jeux de données vise à compresser un grand ensemble de données en un petit ensemble synthétique tout en maintenant la performance prédictive. Nous montrons qu’à mesure que différents groupes démographiques présentent des schémas prédictifs distincts, le processus de distillation peine à préserver simultanément les signaux informatifs pour tous les sous-groupes, que la taille des groupes soit légèrement ou gravement déséquilibrée. Par conséquent, les modèles entraînés sur des données distillées peuvent connaître des baisses de performance substantielles pour certains sous-groupes, ce qui entraîne des écarts d’équité. De manière cruciale, ces écarts ne disparaissent pas simplement en corrigeant le déséquilibre de groupe, puisqu’ils proviennent de désajustements fondamentaux dans les schémas prédictifs des sous-groupes plutôt que de disparités de taille d’échantillon seules. Nous analysons donc formellement l’interaction entre ces deux sources de biais et présentons la solution comme identifiant un barycentre indépendant du déséquilibre de groupe de l’information prédictive qui induit des représentations similaires à travers tous les sous-groupes. En distillant vers cette représentation agrégée partagée, nous montrons que les préoccupations liées à l’équité des groupes peuvent être réduites. Notre approche est compatible avec les méthodes de distillation existantes, et les résultats empiriques montrent qu’elle réduit substantiellement les biais introduits par la distillation des ensembles de données. Le code est disponible à https://github.com/mhmoslemi/COBRA.
Résumé
La formation moderne en IA nécessite souvent d’énormes ensembles de données, ce qui coûte cher en stockage et en calcul. La distillation des ensembles de données résout ce problème en comprimant un grand ensemble de données en un minuscule synthétique qui entraîne les modèles tout aussi bien. Cependant, nous avons découvert que cette compression peut silencieusement amplifier l’injustice : les modèles entraînés sur des données distillées peuvent performer beaucoup moins bien pour les groupes démographiques minoritaires que les modèles entraînés sur les données originales.
Nous avons retracé le problème jusqu’à la façon dont la distillation construit sa cible. Les méthodes standard font la moyenne sur tous les échantillons, ce qui permet aux groupes majoritaires de dominer et élimine les schémas minoritaires du jeu de données compressé. Nous montrons que ce biais ne concerne pas seulement la taille des groupes; Cela dépend aussi de la position des différents groupes démographiques dans l’espace interne de représentation du modèle, et nous formalisons cela par une borne supérieure de l’écart d’équité résultant.
Notre méthode, COBRA, calcule un point central équilibré qui reste également proche de chaque groupe démographique, puis distille l’ensemble de données synthétique vers cette cible juste. À travers sept benchmarks et quatre méthodes de distillation, COBRA réduit considérablement les écarts d’équité tout en préservant ou améliorant la précision.
À mesure que les ensembles de données compressés deviennent courants dans des domaines sensibles comme la santé et la finance, COBRA contribue à s’assurer que ces gains d’efficacité ne se font pas au détriment de l’équité pour les groupes sous-représentés.
TLDR : Nous proposons une méthode de distillation des ensembles de données consciente de l’équité, ciblant les signaux partagés entre groupes, réduisant les conflits de représentation et diminuant la différence d’égalisation des chances sur les benchmarks d’équité, avec une forte généralisation inter-architecture.
FedLog : Classification fédérée personnalisée avec moins de communication et plus de flexibilité
Haolin Yu, Guojun Zhang, Hongliang Li, Pascal Poupart (membre du corps professoral de Vector)
Résumé
L’apprentissage de la représentation fédérée (FRL) vise à apprendre des modèles fédérés personnalisés avec une extraction efficace de caractéristiques à partir de données locales. Les algorithmes FRL qui partagent la majorité des paramètres du modèle font face à des défis importants avec une surcharge de communication énorme. Cette surcharge provient des millions de paramètres de réseaux neuronaux et de la lenteur de l’agrégation de l’heuristique de moyenne. Pour réduire la surcharge, nous proposons FedLog, qui partage suffisamment de résumés de données au lieu des paramètres bruts du modèle. Les résumés de données encodent des statistiques minimales suffisantes d’une famille exponentielle, et l’inférence bayésienne est utilisée pour l’agrégation globale. FedLog aide à réduire la taille des messages et la fréquence des communications. Nous démontrons que les messages partagés sont des statistiques minimales et analysons théoriquement le taux de convergence de FedLog. Pour assurer davantage des garanties formelles de confidentialité, nous étendons FedLog avec le cadre de confidentialité différentiel. Les résultats empiriques démontrent une grande précision d’apprentissage avec une faible surcharge de communication de notre méthode.
Optimisation de la conception en quelques coups en exploitant l’information auxiliaire
Arjun Mani, Carl Vondrick, Richard Zemel (membre du corps professoral de Vector)
Résumé
De nombreux problèmes de conception réels impliquent l’optimisation d’une fonction boîte noire coûteuse f(x), pour laquelle l’optimisation bayésienne est un cadre efficace en échantillonnage. Cependant, bien que le cadre de boîte noire de base offre une récompense scalaire, les expériences réelles génèrent souvent une mine d’informations utiles. Nous introduisons un nouveau cadre où une expérience génère des informations auxiliaires de haute dimension h(x) avec f(x); De plus, un historique des tâches pertinentes déjà résolues est disponible pour accélérer l’optimisation. Nous développons une méthode novatrice basée sur un modèle neuronal qui prédit f(x) pour des conceptions invisibles à partir d’un contexte de quelques plans contenant des observations de h(x). Nous évaluons notre méthode sur deux domaines complexes : la conception matérielle robotique et l’accord des hyperparamètres. Dans les deux domaines, notre méthode permet d’améliorer la prédiction en peu de coups et d’optimiser la conception plus rapidement, surpassant plusieurs méthodes d’optimisation multitâche.
Résumé
Les problèmes de conception sont omniprésents en ingénierie et en sciences naturelles. Par exemple, un biologiste pourrait vouloir concevoir un médicament qui se lie aussi étroitement que possible à un agent pathogène, et un roboticien pourrait vouloir concevoir un bras robotique capable de saisir les objets de façon délicate et stable. Souvent, concevoir de bonnes solutions implique de mener des expériences concrètes, par exemple une expérience en laboratoire humide pour tester la liaison des médicaments. Cette expérience est une « boîte noire », où vous pouvez insérer un design, et obtenir un chiffre mesurant la performance du design. L’objectif est d’optimiser cette métrique avec le moins d’expériences possible.
Il existe plusieurs méthodes d’IA qui décident intelligemment quel design essayer ensuite, en se basant sur les expériences précédentes. Cependant, ce réglage de base en « boîte noire », qui ne retourne qu’un seul nombre mesurant un design, est très simplifié. Les laboratoires scientifiques ou d’ingénierie modernes disposent de capacités expérimentales avancées, capables de réaliser plusieurs observations sur un système. Par exemple, dans la conception de robots, tester un bras robotique peut générer un volume élevé de données de capteurs (provenant de caméras ou capteurs tactiles) ainsi qu’une mesure finale de performance de la conception. Par conséquent, nous introduisons un nouveau paramètre d’optimisation, où un essai génère des « informations supplémentaires » de haute dimension en plus du chiffre mesurant la performance. Cette information supplémentaire peut être très utile pour comprendre non seulement qu’un design échoue, mais aussi *comment* exactement le design échoue, et pourrait être modifié pour réussir.
Nous introduisons une nouvelle méthode d’IA pour ce contexte. Cette méthode implique un modèle de réseau de neurones, entraîné sur un historique de tâches de conception déjà résolues. Il apprend à prendre en compte un petit ensemble de plans évalués pour une tâche, incluant des observations de cette « information supplémentaire », et à prédire quels plans non évalués pourraient avoir une forte récompense et devraient être testés. Après entraînement, ce modèle peut être appliqué à une nouvelle tâche de conception, où il prédit de façon itérative quelle conception essayer ensuite, puis essaie cette conception, répétant jusqu’à ce qu’une conception satisfaisante soit trouvée.
Nous appliquons notre méthode à plusieurs problèmes de conception. Un problème consiste à concevoir des pinces robotiques dont la forme doit être personnalisée pour saisir des objets spécifiques (par exemple, une bouteille). Chaque fois que le gripper entre en contact avec l’objet, il reçoit un retour tactile « supplémentaire » accompagné d’une récompense pour la prise. Nous montrons que notre méthode peut saisir de nouveaux objets qu’elle n’a pas vus lors de l’entraînement, et peut rapidement optimiser la conception des pinces pour l’objet après seulement quelques interactions avec cet objet. Il trouve des conceptions de pinces efficaces pour un nouvel objet beaucoup plus rapidement que les méthodes actuelles. Ainsi, notre travail progresse vers des systèmes plus performants pour la conception pilotée par l’IA, capables de réaliser une conception et une découverte efficaces dans des environnements scientifiques et d’ingénierie réalistes.
TLDR : Nous introduisons un nouveau cadre d’optimisation de conception où un essai fournit des informations auxiliaires de haute dimension au-delà de la récompense, et proposons une approche novatrice pour ce cadre.
FiGuRO – Estimation des dimensions intrinsèques pour les données multimodales
Viktoria Schuster, Sana Tonekaboni (boursière postdoctorale distinguée Vector), Caroline Uhler
Résumé
Déterminer la complexité, ou dimension intrinsèque (DI), des données est fondamental pour un apprentissage efficace et interprétable des représentations. C’est particulièrement difficile dans les contextes multimodaux lorsqu’on essaie d’apprendre des représentations démêlées pour des informations partagées et privées. Les techniques existantes laissent un vide critique : elles sont souvent statiques, unimodales ou, dans le cas des méthodes contrastives, ne s’adaptent implicitement qu’à la DI partagée. Nous introduisons l’optimisation de rang guidée par fidélité (FiGuRO), un cadre pour approximer l’ID des données uni- et multimodales sous des contraintes de capacité du modèle et d’hyperparamètres. FiGuRO apprend les dimensions des projections de bas rang à l’aide de la décomposition en valeurs singulières tronquées et d’un algorithme qui détermine quand réduire ou augmenter la dimension et dans quel espace latent. Le désentremêlement de l’information partagée et privée apparaît comme une propriété émergente de cette optimisation, éliminant le besoin de fonctions auxiliaires complexes de perte. Nous démontrons que FiGuRO surpasse les techniques existantes d’estimation des identifiants et est plus robuste aux changements d’hyperparamètres. À travers des simulations et des données réelles, FiGuRO capture des échelles de DI distinctes et des rapports de sous-espace variables, et décompose avec succès des informations partagées et privées. De plus, nous montrons que FiGuRO peut être appliqué à des modèles modernes uni-modaux pré-entraînés, permettant un désentremêlement efficace et post-hoc de représentations multimodales.
Résumé
Les modèles d’IA modernes apprennent souvent de multiples sources (modalités) simultanément, comme la combinaison des scans médicaux d’un patient avec ses données génétiques. Pour rendre ces modèles efficaces et fiables, les scientifiques doivent déterminer leur véritable complexité sous-jacente (le nombre minimal absolu de facteurs nécessaires pour décrire les données). Cependant, les outils existants ont du mal à différencier l’information partagée entre les sources et les détails propres à une seule.
Pour résoudre cela, nous avons développé un cadre appelé FiGuRO qui estime automatiquement la complexité des flux d’information partagés et uniques en une seule étape. L’algorithme central développe ou réduit les représentations de FiGuRO en fonction de la perfection avec laquelle il peut reconstituer les données originales. En équilibrant ce processus, FiGuRO démêle les concepts partagés des détails spécifiques à chaque modalité.
Nous démontrons le succès de FiGuRO sur divers ensembles de données, incluant des chiffres audio-images appariés et des mesures biologiques complexes. En révélant précisément la quantité d’informations nouvelles que chaque source apporte, FiGuRO aide les chercheurs à déterminer si la collecte de données difficiles ou coûteuses en vaut vraiment la peine. En fin de compte, cela rend les systèmes d’IA multi-sources plus légers et transparents.
TLDR : Nous présentons FiGuRO, un cadre qui estime la dimension intrinsèque des données multimodales en optimisant le rang via SVD dans des espaces latents détriqués sous une contrainte de fidélité.
FlexRank : Décomposition imbriquée des connaissances de bas rang pour le déploiement de modèles adaptatifs
Article de mise en lumière
Riccardo Zaccone, Stefanos Laskaridis, Marco Ciccone (boursier postdoctoral distingué Vector), Samuel Horváth
Résumé
L’échelle croissante des réseaux de neurones profonds, englobant de grands modèles de langage (LLM) et des transformateurs de vision (ViTs), a rendu la formation à partir de zéro prohibitivement coûteuse et le déploiement de plus en plus coûteux. Ces modèles sont souvent utilisés comme des monolithes computationnels à coût fixe, ce qui nuit au déploiement adaptatif selon différents budgets de coûts.
Nous soutenons que les composants imbriqués, ordonnés par importance, peuvent être extraits de modèles préentraînés et activés sélectivement dans le budget computationnel disponible. À cette fin, notre méthode FlexRank proposée exploite la décomposition en poids de bas rang avec une consolidation imbriquée basée sur l’importance pour extraire des sous-modèles de capacités croissantes. Notre approche permet un paradigme « entraîner une fois, déployer partout », offrant un compromis élégant entre coût et performance sans formation à partir de zéro pour chaque budget – faisant progresser le déploiement pratique de grands modèles.
Résumé
Les modèles d’IA modernes peuvent être puissants, mais ils sont souvent coûteux à faire fonctionner : le même grand modèle est généralement utilisé, que l’appareil ait une puissance de calcul abondante ou très faible. Cela rend le déploiement inefficace, surtout sur téléphones, portables, serveurs et applications où certaines entrées sont plus faciles que d’autres. Nous introduisons FlexRank, une méthode qui transforme un modèle d’IA pré-entraîné en une famille de versions plus petites et plus grandes qui partagent toutes les mêmes poids sous-jacents. L’idée clé est de diviser les connaissances du modèle en morceaux ordonnés, afin que les pièces les plus importantes soient utilisées en premier et que des pièces supplémentaires puissent être ajoutées lorsque plus de calculs sont disponibles. Après avoir identifié ces pièces imbriquées, FlexRank les affine en apprenant à chaque version plus petite à imiter le modèle complet original. Cela crée un modèle « entraîner une fois, déployer partout » qui peut échanger en douceur la précision contre la vitesse ou la mémoire sans entraîner ni stocker plusieurs modèles distincts. Nous montrons que cela fonctionne à travers les modèles de langage et de vision, y compris les grands transformateurs. FlexRank pourrait faciliter le déploiement de l’IA avancée sur divers matériels tout en réduisant les calculs inutiles.
TLDR : Une méthode pour décomposer de grands modèles pré-entraînés en modèles adaptatifs imbriqués de bas rang
Cohérence fréquentiste des réseaux ajustés à des données antérieures pour l’estimation causale
Valentyn Melnychuk, Vahid Balazadeh, Stefan Feuerriegel, Rahul G. Krishnan (membre du corps professoral de Vector)
Résumé
Les modèles de fondation basés sur des réseaux ajustés par données préalables (PFN) ont démontré une forte performance empirique en inférence causale en présentant la tâche comme un problème d’apprentissage en contexte. Cependant, il n’est pas clair si les estimateurs causaux basés sur PFN fournissent une quantification de l’incertitude cohérente avec les estimateurs fréquentistes classiques. Dans ce travail, nous comblons cette lacune en analysant la cohérence fréquentiste des estimateurs basés sur le PFN pour l’effet moyen du traitement (ATE). (1) Nous montrons que les PFN existants, lorsqu’ils sont interprétés comme des estimateurs bayésiens ATE, peuvent présenter un biais de confusion induit à priori : le prior n’est pas écrasé asymptotiquement par les données, ce qui, à son tour, empêche la cohérence fréquentiste. (2) Comme remède, nous suggérons d’utiliser une procédure d’étalonnage basée sur une correction postérieure en une étape (OSPC). Nous montrons que l’OSPC aide à restaurer la cohérence fréquentiste et peut fournir un théorème semi-paramétrique de Bernstein-von Mises pour les PFN calibrés (c’est-à-dire que les estimateurs calibrés basés sur PFN et les estimateurs semi-paramétriques classiques efficaces convergent en distribution avec la taille croissante des données). (3) Enfin, nous mettons en œuvre l’OSPC en adaptant les postérieurs martingale au-dessus des PFN. De cette façon, nous pouvons récupérer des postérieurs fonctionnels nuisants à partir de PFN, exigés par l’OSPC. Dans de multiples expériences (semi-)synthétiques, les PFN calibrées avec notre OSPC postérieur martingale produisent une incertitude ATE qui (i) correspond asymptotiquement à l’incertitude fréquentiste et (ii) est bien calibrée dans des échantillons finis comparativement à d’autres estimateurs bayésiens ATE.
Résumé
Beaucoup de décisions en médecine, en politiques publiques et en affaires dépendent de l’estimation de ce qui se passerait si nous modifions une action, comme administrer un traitement ou introduire une politique. Les nouveaux systèmes d’IA appelés réseaux adaptés aux données préalables peuvent faire ces estimations rapidement parce qu’ils apprennent à partir de nombreux ensembles de données simulés avant d’en voir un réel. Cependant, nous avons constaté que ces systèmes peuvent être trop confiants dans les contextes causaux : les mondes simulés utilisés pour la formation contiennent souvent trop peu de confondus, ce qui signifie trop peu de cas où les choix et résultats de traitement sont liés par des facteurs de fond communs. En conséquence, l’IA peut sous-estimer à quel point elle devrait être incertaine quant à l’effet réel d’une intervention. Nous proposons une méthode d’étalonnage qui ajuste l’estimation de l’IA à l’aide d’une correction inspirée de l’inférence causale classique. Cette correction fait en sorte que l’incertitude de l’IA se comporte davantage comme l’incertitude issue d’estimateurs statistiques bien établis, tout en conservant la vitesse et la flexibilité des réseaux adaptés aux données antérieures. Pour rendre la correction pratique, nous montrons aussi comment récupérer l’incertitude nécessaire concernant les composants cachés de modélisation à partir des prédictions du réseau. À travers plusieurs références synthétiques et semi-synthétiques, la méthode corrigée offre une incertitude plus fiable que d’utiliser naïvement les réseaux comme estimateurs causaux. Nos travaux montrent que les modèles de fondation pour les données tabulaires peuvent être utiles pour l’inférence causale, mais seulement lorsque leur incertitude est soigneusement calibrée.
TLDR : Nous montrons que les estimateurs ATE basés sur PFN peuvent être fréquentistes-incohérents en raison de la confusion induite à priori, et nous rétablissons la cohérence et l’incertitude calibrée grâce à des corrections postérieures en une étape utilisant les postérieurs martingale.
De la vision à la réflexion : le découplement de la perception et du raisonnement améliore l’entraînement post-entraînement des modèles vision-langage
Juncheng Wu, Hardy Chen, Haoqin Tu, Xianfeng Tang, Freda Shi (membre du corps professoral du Vector), Hui Liu, Hanqing Lu, Cihang Xie, Yuyin Zhou
Résumé
Les avancées récentes dans les modèles vision-langage (VLM) mettent l’accent sur le raisonnement à longue chaîne de pensée; Pourtant, on constate que leur performance sur les tâches visuelles est principalement limitée par un manque de perception visuelle plutôt que par le raisonnement lui-même. Dans ce travail, nous étudions systématiquement l’interaction entre la perception et le raisonnement dans la VLM après l’entraînement en décomposant leurs capacités en trois étapes distinctes : perception visuelle, raisonnement visuel et raisonnement textuel, en incorporant des données d’entraînement spécialisées. Nous démontrons que la perception visuelle (a) nécessite une optimisation ciblée avec des données spécialisées; (b) sert d’échafaudage fondamental qui doit être solidifié par une formation progressive avant d’affiner le raisonnement visuel; et (c) s’apprend plus efficacement par RL que par la SFT basée sur sous-titres. Nos expériences sur plusieurs VLM démontrent que l’entraînement par étapes améliore constamment à la fois la perception visuelle et la performance de raisonnement par rapport à l’entraînement fusionné. Notamment, les modèles entraînés avec notre approche atteignent une précision de raisonnement supérieure de 1,5% avec des traces de raisonnement plus courtes de 20,8%, ce qui suggère qu’une perception supérieure réduit le besoin d’un raisonnement excessif. De plus, nous montrons que cette mise en scène basée sur les capacités représente une nouvelle dimension du programme orthogonale aux programmes traditionnels basés sur la difficulté, et que la combinaison des deux apporte des gains additifs supplémentaires. Nos modèles d’entraînement par étapes obtiennent des performances supérieures parmi les VLM à poids ouvert, établissant des résultats avancés sur plusieurs tâches mathématiques visuelles et de perception (par exemple, +5,2% sur WeMath et +3,7% sur RealWorldQA) comparativement à la version de base.
Résumé
Les systèmes d’IA modernes peuvent regarder une image et répondre à des questions à son sujet — par exemple, résoudre un problème de géométrie illustré dans un schéma. Pour les améliorer, les chercheurs ont surtout appris à ces systèmes à « penser » plus longtemps, en abordant les problèmes étape par étape. Mais lorsque nous avons examiné où elles se trompent, nous avons constaté que le véritable goulot d’étranglement n’était pas une pensée erronée, mais une vision erronée : dans près de 87% des erreurs, le modèle avait simplement mal interprété l’image. Pire encore, réfléchir plus intensément n’aidait pas — une fois que le modèle lisait mal une image, chaque étape supplémentaire de raisonnement reposait sur cette même mauvaise observation. Nous soutenons que la vision devrait être considérée comme une compétence à part entière et entraînée séparément, avant de raisonner. Nous avons construit une recette d’entraînement qui renforce d’abord la perception visuelle d’un modèle, puis superpose le raisonnement, en utilisant des données dédiées à chaque étape. Nous avons aussi créé un moyen de transformer des ensembles de données à images sous-titrées en données d’entraînement à la perception. Les modèles entraînés de cette façon sont à la fois plus précis et plus efficaces : ils raisonnent environ 21% plus de façon concise parce qu’ils n’ont plus besoin de remettre en question ce qu’ils ont vu. La leçon est simple — une IA qui voit clairement n’a pas besoin de trop réfléchir.
TLDR : Voir d’abord, puis réfléchir. La perception visuelle — et non la longueur du raisonnement — est le goulot d’étranglement dominant pour les VLM. Nous nous entraînons après un nouvel axe de capacité, orthogonal au programme classique de difficulté.
FUSE : Exemples à spectre complet non apprenables via égalisation spectrale
Jiale Cai, Gezheng Xu, Zhihao Li, Ruiyi Fang, Ruizhi Pu, Di wu, Qicheng Lao, Charles X. Ling, Boyu Wang (affilié de la faculté Vector)
Résumé
Les exemples non apprenables (UE) protègent les données d’entraînement en injectant des perturbations imperceptibles afin que les modèles ne parviennent pas à extraire des représentations exploitables. Dans cet article, nous révélons que les EE existants présentent une défaillance critique une fois le filtrage passe-bas appliqué, ce qui indique que les signaux de perturbation effectifs pour l’inapprentabilité se concentrent principalement dans les hautes fréquences. Par conséquent, nous soutenons que les UE fiables devraient rester efficaces sur l’ensemble du spectre. À cette fin, nous proposons des exemples **F**ull-spectre **U**nlearnable via **S**pectral **E**qualisation (**FUSE**), qui vise à générer des perturbations spectraux indépendantes du spectre en égalisant les contributions des différentes bandes et en imposant la cohérence inter-bandes. Plus précisément, FUSE adopte une stratégie de masquage spectrale aléatoire (RSM) lors de l’entraînement du générateur, qui supprime aléatoirement une bande de fréquences contiguë, forçant les bandes restantes à maintenir leur inapprentissabilité. De plus, FUSE intègre davantage le guidage interbande (CBG), qui assure une cohérence mutuelle entre les composants des hautes et basses fréquences, renforçant ainsi l’inapprentissage des basses fréquences et régulant les perturbations des hautes fréquences afin de préserver la fidélité sémantique des images. Des expériences approfondies sur plusieurs ensembles de données, architectures et filtrage spectral démontrent la forte protection obtenue par FUSE.
Résumé
Beaucoup de systèmes d’IA modernes sont entraînés sur de grandes collections d’images en ligne, souvent sans la connaissance ni la permission des créateurs. Une façon proposée de protéger ces données est de modifier légèrement les images afin que les changements soient invisibles pour les humains, tout en empêchant les modèles d’IA d’en tirer des informations utiles. Ces images modifiées sont appelées des exemples inapprendables.
Dans ce travail, nous montrons que de nombreuses méthodes de protection existantes échouent une fois que les images sont légèrement lissées ou compressées, car elles reposent principalement sur des signaux fragiles à haute fréquence faciles à éliminer. Pour résoudre ce problème, nous proposons une nouvelle méthode appelée FUSE, qui répand le signal protecteur plus largement à travers l’image au lieu de le concentrer dans un seul type de motif visuel. En conséquence, la protection reste efficace même après des opérations courantes de traitement d’image.
Nous évaluons FUSE sur plusieurs ensembles de données et architectures de modèles d’IA, et démontrons qu’il offre constamment une protection plus forte et plus fiable que les approches précédentes. Nos résultats suggèrent que les futures méthodes de protection des données devraient être conçues pour rester robustes dans des conditions réalistes de transformations d’images et de traitement.
Ondes planes globales provenant des gaussiennes locales : densités périodiques de charge en un clin d’œil
Jonas Elsborg, Felix Aertebjerg, Luca Anthony Thiede, Alán Aspuru-Guzik (membre du corps professoral de Vector), Tejs Vegge, Arghya Bhowmik
Résumé
Nous introduisons ELECTRAFI, un modèle rapide et différentiable de bout en bout pour prédire les densités de charge périodiques dans les matériaux cristallins. ELECTRAFI construit des gaussiennes anisotropes dans l’espace réel et exploite leurs transformées de Fourier en forme fermée pour évaluer analytiquement les coefficients d’ondes planes via la formule de sommation de Poisson. Cette formulation délègue un comportement non local et périodique aux transformations analytiques, permettant la reconstruction de la densité complète de charge périodique avec une seule FFT inverse. En évitant les sondages explicites en grille dans l’espace réel, la somme périodique d’images et les expansions harmoniques sphériques, ELECTRAFI égale ou dépasse la précision de pointe de la technologie sur des benchmarks périodiques tout en étant jusqu’à 633 $/fois plus rapide que la méthode concurrente la plus forte, reconstruisant les densités de charge cristallines en une fraction de seconde. Lorsqu’il est utilisé pour initialiser les calculs DFT, ELECTRAFI réduit le coût total de calcul DFT jusqu’à $\sim$20%, tandis que les modèles plus lents à densité de charge annulent les économies dues à des temps d’inférence élevés. Nos résultats montrent que la précision et le coût d’inférence déterminent conjointement les accélérations de la DFT de bout en bout et motivent notre attention à l’efficacité.
Résumé
Beaucoup de matériaux importants sont d’abord étudiés sur ordinateur avant d’être fabriqués en laboratoire. Une méthode courante pour cela s’appelle la théorie des fonctions de densité, ou DFT, qui prédit comment les électrons sont disposés à l’intérieur d’un matériau. La DFT est très utile, mais elle peut être lente parce que l’ordinateur doit raffiner à plusieurs reprises la densité électronique jusqu’à trouver une réponse stable.
Dans cet article, nous utilisons l’apprentissage automatique pour fournir une bien meilleure estimation de départ, ce qui aide les calculs de la DFT à se terminer plus rapidement en commençant plus près de la vraie solution. Le défi, c’est que le modèle d’apprentissage automatique lui-même doit aussi être rapide. Si ce n’est pas le cas, le temps économisé en DFT est perdu lors de la prédiction. Nous avons construit ELECTRAFI, un modèle qui prédit les densités électroniques dans les cristaux à l’aide d’un grand ensemble de simples « blobs » 3D appelés gaussiens. Au lieu de vérifier chaque point dans l’espace un par un, ELECTRAFI convertit ces blobs directement dans le format mathématique utilisé par de nombreux programmes DFT. Cela rend la prédiction à la fois périodique naturellement, comme un cristal, et très rapide.
Nous avons constaté qu’ELECTRAFI est aussi précis que les meilleures méthodes existantes tout en étant des centaines de fois plus rapide. Lorsqu’elle est utilisée dans des calculs réels de DFT, elle réduit le temps total de calcul jusqu’à environ 20%.
C’est significatif car des milliards d’heures de calcul sont consacrées chaque année à l’ensemble du temps aux calculs de la DFT, et des méthodes comme ELECTRAFI peuvent aider à rendre la simulation des matériaux à grande échelle plus rapide, moins coûteuse et moins énergivore.
TLDR : prédiction ultra-rapide de densité de charge dans les systèmes périodiques
Lissage des gradients : mises à jour par couches de couplage pour une optimisation améliorée
Haoming Meng, Anton Sugolov, Vardan Papyan (membre du corps professoral vectoriel)
Résumé
Les réseaux neuronaux profonds avec des blocs répétés, comme les transformers et les ResNets, présentent souvent des relations structurées à travers des couches qui émergent lors de l’entraînement. Motivés par cette observation, nous introduisons un paradigme général d'*Augmentation du gradient par profondeur*, dans lequel la mise à jour appliquée à une couche peut dépendre des mises à jour de l’optimiseur de base calculées pour d’autres couches. Nous étudions une instanciation de cette idée, appelée *Gradient Smoothing*, qui couple les mises à jour des optimiseurs à travers la profondeur et admet une interprétation naturelle comme une méthode de préconditionnement structurée. Notre cadre fonctionne directement sur des vecteurs de mise à jour bloc par bloc produits par des optimiseurs de base arbitraires (par exemple, SGD, Adam, Muon), appliquant des opérateurs de lissage structuré en profondeur tels que la moyenne pondérée locale avec un minimum de surcharge de calcul. Nous évaluons le lissage de gradient à travers un ensemble diversifié d’architectures et de régimes d’entraînement, incluant le préentraînement des modèles de langage, la post-formation RL des LLM sur des tâches de raisonnement, la modélisation de diffusion et la classification d’images avec des transformateurs de vision. Dans ces contextes, le lissage du gradient améliore systématiquement la convergence et la généralisation sans modifier les architectures de modèles ni les objectifs d’entraînement. Nous montrons en plus que le lissage favorise une évolution plus structurée des représentations en profondeur, suggérant un lien entre le couplage structuré des mises à jour et l’organisation interne des représentations apprises. Ces résultats positionnent le lissage de gradient comme une approche simple et largement applicable pour améliorer la formation dans les réseaux profonds modernes.
Résumé
Les systèmes d’IA modernes tels que les grands modèles de langage, les transformateurs de vision et les modèles de diffusion sont construits à partir de nombreuses couches architecturales répétées. Bien que ces couches apprennent souvent des comportements connexes pendant l’entraînement, les algorithmes d’optimisation actuels mettent généralement à jour chaque couche indépendamment.
Nous introduisons un nouveau cadre d’entraînement appelé Depth-wise Gradient Augmentation, qui permet aux couches de partager de l’information via leurs mises à jour d’optimisation. Nous étudions un exemple simple de cette idée appelé lissage de gradient, où les mises à jour des couches voisines sont combinées avant d’être appliquées au modèle.
Le lissage de gradient peut être ajouté à des méthodes d’entraînement existantes avec très peu de coûts de calcul et ne nécessite pas de modifier l’architecture du modèle ou l’objectif d’entraînement. Nous avons testé la méthode sur un large éventail de tâches d’apprentissage automatique, incluant le préentraînement des modèles de langage, l’apprentissage par renforcement axé sur le raisonnement, la classification d’images et la génération d’images.
Dans ces contextes, le lissage de gradient a constamment amélioré l’efficacité de l’entraînement et la performance du modèle. Nous avons aussi constaté qu’elle encourage les représentations à évoluer de façon plus fluide et cohérente entre les couches. Ces résultats suggèrent que tirer parti de la structure partagée entre les couches peut être une façon simple et globalement utile d’entraîner plus efficacement les systèmes d’apprentissage profond modernes.
Apprentissage hiérarchique des politiques via la décomposition spectrale
Shuxin Cao, Liquan Wang, Walker Byrnes, Yiye Chen, Yilun Du, Animesh Garg (affilié de la faculté Vector)
Résumé
Dans cet article, nous identifions une décomposition sémantique dans les séquences d’actions robotiques, séparant l’intention de mouvement au niveau de la tâche des raffinements au niveau de l’exécution. En analysant les actions dans le domaine spectral à l’aide de la transformée cosinus discrète (DCT), on observe que les composantes basse fréquence capturent les trajectoires du mouvement global, tandis que les composantes hautes fréquences codent un timing précis, un alignement et des comportements de contact. Motivés par cette structure, nous proposons la Politique Spectrale Causale (CSP), qui modélise la génération d’actions comme un processus causal grossier à fin : le mouvement grossier est prédit à partir de l’observation et du langage, et les corrections fines sont produites conditionnellement sur la trajectoire réalisée. À travers la simulation et les évaluations réelles, le CSP surpasse constamment les références solides sur les tâches de manipulation sensibles à la précision. De plus, nous proposons l’injection de bruit par téléopération inspirée par l’humain comme méthode d’augmentation de données, dans laquelle notre approche démontre une forte robustesse face à des démonstrations bruyantes.
Résumé
Apprendre aux robots à manipuler des objets avec précision est difficile parce qu’un bon mouvement nécessite à la fois une trajectoire globale correcte et de petites corrections de dernière minute, et ces deux choses doivent être apprises différemment. Nous montrons que convertir les mouvements robotiques en composantes fréquentielles sépare naturellement ces deux niveaux. Notre méthode, CSP, apprend d’abord le mouvement grossier, puis génère des corrections fines conditionnées à celui-ci. Cela améliore la performance sur des tâches précises et rend l’apprentissage plus robuste face aux démonstrations bruyantes qui surviennent lorsque les humains pilotent des robots à distance.
IDRBench : Comprendre la capacité des grands modèles de langage en recherche interdisciplinaire
Yuanhao Shen, Daniel de Sousa, Ricardo de Andrade Nascimento, Hongyu Guo, Xiaodan Zhu (membre du corps professoral de Vector)
Résumé
L’innovation est une force motrice clé de la civilisation humaine. À mesure que le corpus de connaissances a considérablement grandi, le pont entre différentes disciplines, où des innovations importantes émergent souvent, est devenu de plus en plus difficile. Les avancées récentes dans les modèles d’apprentissage automatique, en particulier les grands modèles de langage (LLM), ont permis un accès efficace à de vastes sources de connaissances et démontré des capacités impressionnantes de raisonnement, offrant d’importantes opportunités de découverte interdisciplinaire. Nos recherches visent à comprendre les capacités des LLM à la fine pointe de la technologie à intégrer les connaissances de différents domaines pour la recherche interdisciplinaire (IDR). Pour répondre à ce problème fondamental, nous introduisons IDRBench, un cadre novateur qui inclut à la fois des ensembles de données et des tâches d’évaluation : (1) l’identification des articles IDR, (2) l’intégration des idées IDR, et (3) la recommandation d’idées IDR. Notre étude sur dix LLM traditionnels fournit une analyse complète de leur comportement et établit des repères et des références pour des recherches futures. À notre connaissance, IDRBench est le premier à fournir une enquête complète sur la capacité IDR des LLM.
Résumé
De nombreuses découvertes importantes surviennent lorsque des idées de différents domaines sont réunies, mais il devient de plus en plus difficile de trouver des liens significatifs entre les disciplines à mesure que les connaissances scientifiques continuent de croître. Les grands modèles de langage, comme les systèmes de type ChatGPT, peuvent lire et raisonner sur de grandes quantités de texte, ce qui peut aider les chercheurs à découvrir des liens qui seraient autrement manqués. Cependant, nous ne savons toujours pas à quel point ces modèles peuvent réellement comprendre, évaluer et recommander des idées de recherche interdisciplinaire.
Dans ce travail, nous introduisons IDRBench, une nouvelle référence pour tester si les grands modèles de langage peuvent soutenir la découverte interdisciplinaire. IDRBench évalue des modèles selon trois tâches : identifier des articles interdisciplinaires, expliquer comment des idées de différents domaines peuvent être intégrées, et recommander des orientations prometteuses de recherche interdisciplinaire. Nous utilisons cette référence pour étudier dix modèles de langage largement utilisés et comparer leurs forces et faiblesses.
Nos résultats offrent la première vision complète de la performance des modèles de langage actuels dans les tâches de recherche interdisciplinaire. Ce travail peut aider les chercheurs à mieux comprendre quand les LLM sont utiles pour la découverte scientifique, où ils échouent encore, et comment les futurs outils d’IA pour la recherche peuvent être améliorés.
TLDR : Nous introduisons un repère novateur pour comprendre les capacités de recherche interdisciplinaire du LLM.
Le transport optimal entropique inverse résout l’apprentissage semi-supervisé via la maximisation de la vraisemblance des données
Mikhaïl Persiianov, Arip Asadulaev, Nikita Andreev, Nikita Starodubcev, Dmitry Baranchuk, Anastasis Kratsios (affiliée à la faculté Vector), Evgeny Burnaev, Aleksandr Korotin
Résumé
L’apprentissage des distributions conditionnelles $\pi^\star(\cdot|x)$ est un problème central en apprentissage automatique, qui est généralement abordé via des méthodes supervisées avec des données appariées $(x,y) \sim \pi^\star$. Cependant, l’acquisition d’échantillons de données appariés est souvent difficile, surtout dans des problèmes comme la traduction de domaine. Cela nécessite le développement de modèles *semi-supervisés* qui utilisent à la fois des données appariées limitées et des échantillons i.i.d. non appariés supplémentaires $x \sim \pi^\star_x$ et $y \sim \pi^\star_y$ à partir des distributions marginales. L’utilisation de telles données combinées est complexe et repose souvent sur des approches heuristiques. Pour remédier à ce problème, nous proposons un nouveau paradigme d’apprentissage qui intègre harmonieusement les données jumelées et non appariées en utilisant des techniques de maximisation de la vraisemblance des données. Nous démontrons que notre approche se connecte aussi, de façon intrigante, au transport optimal entropique inverse (OT). Cette découverte nous permet d’appliquer les avancées récentes en OT computationnelle pour établir un algorithme d’apprentissage *de bout en bout* afin d’obtenir $\pi^\star(\cdot|x)$. De plus, nous dérivons la propriété d’approximation universelle, démontrant que notre approche peut théoriquement récupérer de vraies distributions conditionnelles avec une erreur arbitrairement faible. Enfin, nous démontrons par des tests empiriques que notre méthode apprend efficacement les distributions conditionnelles en utilisant simultanément des données appariées et non appariées.
Résumé
Les systèmes d’apprentissage automatique doivent souvent apprendre les relations entre deux types de données. Par exemple, un système peut devoir traduire des images entre styles, prédire les conditions météorologiques à partir de mesures de capteurs, ou générer des sorties basées sur des exemples limités. La plupart des méthodes existantes nécessitent de grandes collections de paires entrées-sorties parfaitement assorties pour l’entraînement. Cependant, dans de nombreuses applications réelles, ces données appariées sont coûteuses ou difficiles à obtenir, tandis que des collections séparées d’entrées et de sorties sont beaucoup plus faciles à collecter.
Dans ce travail, nous introduisons une nouvelle méthode qui peut apprendre à la fois d’une petite quantité de données appariées et d’une grande quantité de données non appariées en même temps. Notre approche repose sur la manière dont le modèle explique au maximum les données observées, tout en s’inspirant du transport optimal, un cadre mathématique pour comparer et transformer les distributions de probabilité.
Nous montrons théoriquement que notre méthode peut récupérer des relations complexes entre des domaines et fournir un algorithme efficace pour l’entraîner en pratique. Dans des expériences sur des tâches synthétiques, la prévision météorologique, la traduction d’images et la classification, notre approche surpasse systématiquement les méthodes semi-supervisées existantes, surtout lorsqu’un nombre limité d’exemples appariés sont disponibles. Par exemple, notre méthode peut apprendre des traductions d’images réalistes et des prévisions météorologiques probabilistes précises tout en nécessitant beaucoup moins de supervision par paires que les approches standards.
Nos résultats suggèrent que combiner des données appariées et non appariées grâce à un apprentissage fondé sur la probabilité peut considérablement améliorer l’efficacité et la fiabilité des données dans les systèmes d’apprentissage automatique.
Échantillonnage MAP local pour les modèles de diffusion
Shaorong Zhang, Rob Brekelmans (ancien boursier postdoctoral distingué Vector), Greg Ver Steeg
Résumé
L’échantillonnage postérieur par diffusion (DPS) offre une approche bayésienne de principe pour les problèmes inverses en échantillonnant à partir de $p(x_0 \mid y)$. Bien que l’échantillonnage postérieur soit précieux pour capter l’incertitude et la multimodalité, de nombreux contextes classiques et pratiques de problèmes inverses priorisent finalement une estimation ponctuelle précise — notamment l’estimateur MAP, qui a longtemps servi d’objectif standard de reconstruction en imagerie et en applications scientifiques. Nous introduisons l’échantillonnage local MAP (LMAPS), un nouveau cadre d’inférence qui résout de manière itérative les sous-problèmes locaux de MAP le long de la trajectoire de diffusion. Cette perspective clarifie leur lien avec le MAP global et le DPS, offrant une interprétation probabiliste unifiée pour les méthodes basées sur l’optimisation. Sur cette base, nous développons des algorithmes pratiques avec une approximation de covariance motivée par l’hypothèse a priori gaussienne, un objectif reformulé pour la stabilité et l’interprétabilité. À travers un large éventail de tâches de restauration d’images et scientifiques, le LMAPS atteint des performances à la fine pointe de la technologie.
Résumé
Les systèmes d’IA appelés modèles de diffusion peuvent générer des images très réalistes en transformant progressivement le bruit aléatoire en contenu structuré. Au-delà de la création d’images à partir de zéro, elles sont de plus en plus utilisées pour résoudre des « problèmes inverses » — des tâches telles que la netteté de photos floues, le comblement de régions manquantes d’une image, la reconstruction d’IRM à partir de mesures limitées, ou l’imagerie de trous noirs à partir de données rares de radiotélescopes. Nous introduisons l’échantillonnage local MAP (LMAPS), une méthode qui, à chaque étape du processus de diffusion, recherche l’image propre la plus probable qui correspond à la fois à l’état bruyant actuel et à la mesure observée. Cette perspective unifie et clarifie plusieurs approches antérieures sous un cadre de principe. Dans un large éventail de tâches de restauration d’images et de problèmes scientifiques — y compris la reconstitution IRM et l’imagerie par trou noir — LMAPS produit des reconstructions plus nettes et plus précises que les méthodes existantes, souvent à un coût computationnel moindre.
Pensées ancrées : Synthétiser des problèmes visuels ancrés et distiller des chaînes de raisonnement à grande échelle
David Acuna, Chao-Han Huck Yang, Yuntian Deng (affilié de la faculté Vector), Jaehun Jung, Ximing Lu, Prithviraj Ammanabrolu, Hyunwoo Kim, Yuan-Hong Liao, Yejin Choi
Résumé
Malgré des progrès rapides, le raisonnement multimodal manque encore d’une approche systématique pour synthétiser des ensembles de données centrés sur la vision à grande échelle, au-delà des mathématiques visuelles. Nous introduisons un cadre capable de synthétiser des problèmes centrés sur la vision couvrant divers niveaux de complexité, et le jeu de données résultant avec plus de 1 million de problèmes de haute qualité, incluant : traces de raisonnement, données de préférences et prompts d’instruction supportant la SFT, hors ligne et en ligne RL. Notre cadre de synthèse centré sur la vision utilise un processus en deux étapes axé sur : (1) la génération de questions diverses et vérifiables à partir d’images existantes à grande échelle, et (2) la création de problèmes visuels compositionnels complexes en fusionnant des questions plus simples.
Fait remarquable, l’ajustement précis de Qwen2.5-VL-7B sur nos données surpasse les bases de données ouvertes existantes sur les benchmarks évalués centrés sur la vision, et nos meilleures configurations égalent ou surpassent des modèles solides de données fermées comme MiMo-VL-7B-RL sur V*Bench, CV-Bench et MMStar-V. Notamment, bien qu’entièrement centrées sur la vision, nos données se transfèrent positivement vers le raisonnement uniquement textuel (MMLU-Pro, +3,7%) et le raisonnement audio (MMAU, +1,32%), démontrant son efficacité. De même, malgré l’absence de données visuelles incorporées, nous observons des gains notables (NiEH, +8,8%) lors de l’évaluation de l’assurance qualité incorporée ouverte. Enfin, nous utilisons nos données pour analyser de manière exhaustive, à l’échelle (1M+), l’ensemble du pipeline post-entraînement du VLM, montrant que (i) la SFT sur des données de haute qualité avec des comportements cognitifs sur des traces de raisonnement est essentielle pour étendre le RL en ligne, (ii) la RL hors ligne pourrait égaler la performance du RL en ligne tout en désagrégant les besoins de calcul, et, (iii) la SFT sur des données de haute qualité améliore également hors domaine, Transfert intermodal.
Résumé
Ce travail introduit un moyen de créer automatiquement plus d’un million de questions basées sur des images qui aident les systèmes d’IA multimodals à mieux raisonner sur ce qu’ils voient. En se concentrant sur des objets spécifiques et en combinant des questions simples en questions plus difficiles, la méthode génère des données qui apprennent aux modèles à raisonner sur ce qu’ils voient, à vérifier leurs réponses et à se remettre des erreurs. Cela améliore la performance sur les tâches visuelles et montre aussi des bénéfices pour le raisonnement textuel, audio et intégré.
TLDR : Une génération de données, un cadre pour synthétiser des problèmes centrés sur la vision couvrant divers niveaux de complexité, et un ensemble de données comprenant plus de 1 million de problèmes de haute qualité, incluant le support de la SFT, du RL hors ligne et en ligne.
L’émergence mécanistique de l’ancrage symbolique dans les modèles de langage
Shuyu Wu, Ziqiao Ma, Xiaoxi Luo, Yidong Huang, Josue Torres-Fonseca, Freda Shi (membre du corps professoral Vector), Joyce Chai
Résumé
L’ancrage symbolique (Harnad, 1990) décrit comment des symboles tels que les mots acquièrent leur sens en se connectant à des expériences sensorimotrices réelles. Des travaux récents ont montré des preuves préliminaires que le grounding peut émerger dans des modèles de langage (vision-)entraînés à grande échelle sans utiliser d’objectifs explicites de grounding. Pourtant, les lieux spécifiques de cette émergence et les mécanismes qui la motivent restent largement inexplorés. Pour résoudre ce problème, nous introduisons un cadre d’évaluation contrôlée qui retrace systématiquement comment le fondement symbolique apparaît dans les calculs internes par l’analyse mécaniste et causale. Nos résultats montrent que l’ancrage se concentre dans les calculs de couche intermédiaire et est mis en œuvre par le mécanisme d’agrégats, où les têtes d’attention agrégent le terrain environnemental pour soutenir la prédiction des formes linguistiques. Ce phénomène se réplique dans le dialogue multimodal et entre architectures (Transformers et modèles d’espace d’états), mais pas dans les LSTM unidirectionnels. Nos résultats fournissent des preuves comportementales et mécanistiques que l’ancrage symbolique peut émerger dans les modèles de langage, avec des implications pratiques pour la prédiction et le contrôle potentiel de la fiabilité de la génération.
Résumé
Quand les gens utilisent un mot comme « cheval », son sens est lié à des choses qu’ils ont vues ou vécues dans le monde. Ce lien entre les mots et les preuves du monde est appelé ancrement. Dans ce travail, nous étudions si les modèles de langage peuvent faire de même : nous nous demandons s’il est possible que l’ancrage émerge de lui-même pendant l’entraînement ordinaire, et si oui, comment. Nous étudions cette question en créant des situations contrôlées où la même idée apparaît sous deux formes distinctes : l’une comme partie de l’environnement et l’autre comme langage ordinaire. Par exemple, un modèle peut voir des preuves concernant un cheval et se voir demander de prédire le mot « cheval » dans une phrase. Nous comparons les cas où les preuves correspondent au mot à ceux où ce n’est pas le cas, et nous examinons le modèle pour identifier quelles parties facilitent la bonne prédiction. Nous constatons que la plupart des architectures de modèles modernes, y compris les transformers, apprennent cette connexion lors de l’entraînement ordinaire, même sans qu’on leur dise explicitement quels mots correspondent à quelles preuves. Le lien est le plus fort au centre du modèle et est porté par des schémas d’attention qui apportent des informations environnementales pertinentes au mot prédit. Nous observons un comportement similaire dans les dialogues textuels et imaginaires, bien que pas dans un modèle récurrent plus simple. Ces résultats aident à expliquer comment l’ancrage peut apparaître dans les modèles de langage et peuvent offrir des outils pour détecter ou réduire les générations de modèles de langage non fiables.
TLDR : Nous fournissons des preuves comportementales et mécanistes que l’ancrage symbolique peut émerger dans les modèles de langage (multimodèles).
Attribution de mouvement pour la génération vidéo
Article de mise en lumière
Xindi Wu, Despoina Paschalidou, Jun Gao, Antonio Torralba, Laura Leal-Taixé, Olga Russakovsky, Sanja Fidler (membre du corps professoral Vector), Jonathan Lorraine
Résumé
Malgré les progrès rapides des modèles de génération vidéo, le rôle des données dans l’influence du mouvement est mal compris. Nous présentons Motive (MOTIon attribution pour Video gEneration), un cadre d’attribution de données centré sur le mouvement et basé sur des gradients, qui s’adapte à des ensembles de données vidéo modernes, volumineux et de haute qualité. Nous utilisons cela pour étudier quels clips d’ajustement fin améliorent ou dégradent la dynamique temporelle. Le motif isole la dynamique temporelle de l’apparence statique via des masques de perte pondérés par le mouvement, permettant un calcul d’influence spécifique au mouvement efficace et évolutif. Sur les modèles texte en vidéo, Motive identifie des extraits qui influencent fortement le mouvement et guide la curation des données qui améliore la cohérence temporelle et la plausibilité physique. Avec des données à forte influence sélectionnées par Motive, nous améliorons à la fois la fluidité du mouvement et le degré dynamique sur VBench, atteignant un taux de victoire par préférence humaine de 74,1% comparé au modèle de base pré-entraîné. À notre connaissance, c’est le premier cadre à attribuer le mouvement plutôt qu’à l’apparence visuelle dans les modèles vidéo génératifs et à l’utiliser pour organiser l’ajustement fin des données.
Résumé
Les générateurs vidéo par IA deviennent impressionnants, mais leur mouvement semble toujours étrange : les personnages dérivent, les objets passent de façon impossible, et la physique s’effondre d’une façon que les humains remarquent immédiatement. Nous n’avons aucun moyen clair de demander quelles vidéos de formation ont appris à un modèle ces mauvaises habitudes, ni lesquelles pourraient les corriger. La plupart des outils existants pour retracer la façon dont les données d’entraînement sont sorties ont été conçus pour des images fixes, où il n’y a pas de mouvement à expliquer.
Nous avons construit MOTIVE, la première méthode qui retrace le mouvement d’une vidéo générée jusqu’aux extraits d’entraînement spécifiques qui l’ont influencée, indépendamment de l’apparence de la scène. MOTIVE se concentre sur les parties mobiles de chaque vidéo et demande à quel point chaque clip d’entraînement a poussé le modèle à produire ce type de mouvement. Comme les scores sont spécifiques au mouvement, on peut repérer la petite tranche de données d’entraînement, environ un clip sur cent, qui améliore le plus la façon dont le modèle se déplace.
Lorsque nous avons réentraîné un générateur vidéo open source populaire uniquement sur cette tranche du haut, les spectateurs humains préféraient son mouvement 74% du temps. MOTIVE offre aux développeurs de modèles vidéo un moyen pratique de sélectionner de meilleurs ensembles d’entraînement, produisant des vidéos plus fluides et plus plausibles physiquement sans nécessiter de collecte de données supplémentaires.
TLDR : Nous proposons Motive, un cadre d’attribution de données évolutif et centré sur le mouvement pour la génération de vidéos afin d’identifier quels clips d’entraînement améliorent ou dégradent la dynamique du mouvement, permettant la curation et plus encore.
MultiLoReFT : Découplage des sous-espaces partagés et spécifiques à la modalité dans l’apprentissage multimodal via l’ajustement fin par représentation de bas rang
Sana Tonekaboni (boursière postdoctorale distinguée Vector), Viktoria Schuster, Caroline Uhler
Résumé
La perception et la prise de décision dans le monde réel sont intrinsèquement multimodales, intégrant des signaux complémentaires entre différentes modalités. Cependant, l’entraînement de modèles multimodaux rencontre deux principaux obstacles. Premièrement, collecter des ensembles de données multimodaux appariés à grande échelle, bien alignés, est souvent impraticable, ce qui rend la formation multimodale de bout en bout difficile. Deuxièmement, les représentations multimodales existantes entremêlent fréquemment l’information partagée entre modalités avec des informations spécifiques à chaque modalité, ce qui nuit à l’interprétabilité et au contrôle. Nous introduisons MultiLoReFT, un cadre d’ajustement fin de représentation de bas rang efficace et évolutif pour l’apprentissage multimodal avec des modèles unimodaux pré-entraînés. MultiLoReFT étend l’adaptation de bas rang au contexte multimodal et apprend des sous-espaces de projection interprétables qui découplent l’information partagée de l’information spécifique à la modalité. À travers des benchmarks simulés et réels, elle produit des représentations qui soutiennent la prédiction multimodale tout en révélant explicitement comment l’information partagée et spécifique à la modalité est distribuée entre les modalités.
Résumé
MultiLoReFT est un cadre pour construire des modèles d’IA multimodaux à partir de modèles préentraînés qui comprennent déjà des types de données individuels, tels que le texte, l’audio ou les images. Au lieu d’entraîner un grand modèle multimodal à partir de zéro, il ajuste efficacement ces représentations existantes en utilisant une approche compacte de bas rang. Son objectif principal est l’interprétabilité : il sépare l’information partagée entre différentes modalités de l’information spécifique à chaque modalité, rendant plus clair ce que chaque source de données apporte et sur quels motifs le modèle s’appuie. À travers les tâches simulées et réelles, MultiLoReFT soutient une prédiction multimodale précise tout en offrant une vue plus transparente de la façon dont l’information multimodale est organisée.
TLDR : Ajustement fin efficace des paramètres pour l’apprentissage de représentations multimodales avec meilleure interprétabilité.
Aiguilles dans la botte de foin : traiter la dilution du signal améliore la modélisation et l’évaluation de la réponse aux perturbations scRNA-seq
Gabriel Mejia, Henry Miller, Francis Leblanc, Bo Wang (membre du corps professoral de Vector), Brendan Swain, Lucas Paulo de Lima Camillo
Résumé
Recent benchmarks reveal that single-cell perturbation response models are often outperformed by simply predicting the dataset mean. Through large-scale *in silico* simulations, together with analyses of two real-world perturbation datasets, we trace this anomaly to a metric artifact: unweighted error metrics systematically reward mean predictions when perturbation effects are sparse. To address this limitation, we introduce differentially expressed gene (DEG)-aware metrics—weighted mean-squared error (WMSE) and weighted delta $R^{2}$ ($R^{2}_{w}(\Delta)$)—that sensitively measure error in niche, perturbation-specific signals. We further propose explicit negative and positive performance baselines to calibrate these metrics. Under this framework, the mean baseline sinks to null performance, while genuinely informative predictors are correctly rewarded. Finally, we show that using WMSE as a training objective reduces mode collapse and improves predictive performance across multiple model architectures.
Résumé
La capacité de prédire de façon fiable la réponse des cellules aux perturbations en laboratoire pourrait faire économiser des années et des ressources dans le processus de développement de médicaments. Cependant, des algorithmes conçus à cette fin font actuellement face à la controverse : plusieurs méthodes très médiatisées revendiquent des performances exceptionnelles, tandis qu’un benchmarking indépendant trouve leurs résultats pires que la simple prédiction d’une moyenne. Dans notre article, nous explorons cette divergence et retraçons la question jusqu’aux comportements inattendus de métriques courantes appliquées à des données d’expression génique de haute dimension.
Nous trouvons un principal coupable sur le problème d’une aiguille dans la botte de foin : seule une infime fraction de gènes change de manière significative sous une perturbation. Cela signifie qu’une prédiction moyenne est en fait correcte pour la grande majorité des gènes, mais est fausse pour ceux qui comptent. Les métriques actuelles ne tiennent pas compte de cela et récompensent donc la statistique plutôt que l’estimation biologique. À partir de ces enseignements, nous proposons un protocole standard novateur pour évaluer la performance du modèle qui inclut deux nouvelles métriques sensibles à la niche ainsi que des contrôles positifs et négatifs.
Nous avons alors réalisé qu’une de ces métriques pouvait être réutilisée comme signal d’entraînement. Sous cette nouvelle supervision, les modèles se sont améliorés par rapport à leur entraînement initial lorsqu’ils ont été évalués selon des métriques indépendantes. Cette découverte a été reproduite à travers plusieurs familles de méthodes, suggérant que se concentrer sur des signaux de niche forts est une stratégie efficace pour apprendre comment les cellules réagissent aux perturbations.
TLDR : Lorsque les effets de perturbation sont limités, les métriques non pondérées récompensent les prédictions de moyennes; Les métriques sensibles au DEG et l’entraînement pondéré restaurent la sensibilité et améliorent la performance.
Sur l’effondrement de l’optimisation relative des politiques par groupe dans la recherche d’agents : le déplacement paresseux de la vraisemblance
Wenlong Deng, Yushu Li, Boying Gong, Yi Ren, Christos Thrampoulidis, Xiaoxiao Li (membre du corps professoral de Vector)
Résumé
L’apprentissage par renforcement (RL) intégré aux outils (TI) permet aux grands modèles de langage (LLM) d’effectuer un raisonnement en plusieurs étapes en interagissant avec des outils externes tels que les moteurs de recherche et les récupérateurs. Group Relative Policy Optimization (GRPO), illustrée par le récent Search-R1, offre une convergence rapide et une formulation sans valeur qui la rend attrayante pour ce contexte, tout en souffrant constamment d’un effondrement de l’entraînement. Nous identifions le déplacement paresseux de la vraisemblance (LLD), une réduction systématique ou stagnation de la probabilité de réponses correctes et incorrectes, comme le mécanisme central à l’origine de cette défaillance. La LLD apparaît tôt et déclenche une spirale de mort de LLD auto-renforçante, où la probabilité décroissante entraîne des réponses de faible confiance, gonflent les gradients et, ultimement, provoquent un effondrement. Nous caractérisons empiriquement ce processus à travers des modèles selon une tâche de réponse intégrée à la recherche à la Search-R1, révélant une trajectoire cohérente en trois phases : stagnation précoce, décroissance progressive et effondrement accéléré. Pour y remédier, nous proposons un LLDS de régularisation préservant la probabilité qui ne s’active que lorsque la vraisemblance d’une action de réponse diminue, et qui régularise uniquement les jetons responsables. Cette structure à grain fin atténue la LLD avec un minimum d’interférence. Notre méthode stabilise l’entraînement, prévient l’explosion du gradient et offre des améliorations substantielles de performance sur sept benchmarks, incluant des améliorations relatives de +45,2% sur Qwen2,5-3B et de +37,1% sur Qwen2,5-7B par rapport à l’entraînement GRPO classique. Nos résultats établissent le LLD comme un goulot d’étranglement auparavant négligé dans le TIRL basé sur GRPO et offrent une voie pratique vers une formation stable et évolutive du RL intégré par outils.
Résumé
L’apprentissage par renforcement intégré aux outils permet aux grands modèles de langage de résoudre des tâches complexes en utilisant des outils externes tels que les moteurs de recherche. Cependant, une méthode d’entraînement populaire appelée GRPO devient souvent instable et s’effondre pendant l’entraînement.
Nous identifions la cause principale de cette défaillance, appelée déplacement de vraisemblance paresseuse (LLD), où le modèle perd progressivement confiance dans les réponses correctes et incorrectes, ce qui entraîne des mises à jour instables et un effondrement éventuel. Pour y remédier, nous proposons la LLDS, une méthode de stabilisation légère qui empêche sélectivement les chutes de confiance nuisibles.
Notre approche stabilise l’entraînement, évite l’explosion du gradient et améliore significativement la performance sur sept étalons, atteignant des gains allant jusqu’à 45,2% par rapport à la formation standard du GRPO. Ces résultats offrent une voie pratique vers des systèmes d’IA plus fiables et évolutifs utilisant des outils.
OptiFluence : conception de principes des canaris de la vie privée
Mohammad Yaghini, Michael Aerni, Junrui Zhang, Nicolas Papernot (membre du corps professoral de Vector), Florian Tramer
Résumé
L’audit de la vie privée s’est imposé comme un outil pratique pour estimer empiriquement la fuite de données d’entraînement dans les modèles d’apprentissage automatique, contrairement aux limites démontrables mais souvent trop pessimistes fournies par l’analyse différentielle de la vie privée. Une stratégie courante consiste à utiliser des attaques d’inférence d’appartenance pour détecter la présence de canaris spécifiques — des points de données choisis pour maximiser le succès des attaques — dans les données d’entraînement. Cependant, les conceptions existantes de canaris sont en grande partie heuristiques, reposant sur des échantillons mal étiquetés ou hors distribution. Nous comblons cette lacune en formulant la conception du canari comme un problème d’optimisation à deux niveaux, où le modèle est entraîné dans la boucle interne et le canari est optimisé dans la boucle extérieure pour maximiser sa détectabilité. Pour résoudre ce problème, nous développons OptiFluence, un cadre d’optimisation évolutif qui combine (i) l’initialisation en sélectionnant des candidats à l’aide de fonctions d’influence et (ii) l’optimisation déroulée avec des techniques efficaces en mémoire. Notre approche atteint des performances empiriques remarquables sur quatre ensembles de données. Les canaris optimisés atteignent des taux de détection quasi parfaits de 99,6% à 0,1% de taux de faux positifs sur CIFAR-10, surpassant les références dans la distribution de 4 $ et plusieurs fois. De manière cruciale, ces canaris se transfèrent efficacement entre différentes architectures de modèles sans réentraînement, ce qui permet des audits pratiques de confidentialité par des tiers. Cette transférabilité permet aux régulateurs et auditeurs d’évaluer la confidentialité des modèles sans avoir à avoir accès à une infrastructure de formation propriétaire ou à des ressources computationnelles substantielles.
Résumé
Lorsque les systèmes d’IA sont entraînés sur des données personnelles sensibles (dossiers médicaux, transactions financières ou messages privés), ils peuvent involontairement « mémoriser » des détails sur des individus spécifiques. Cela crée un véritable risque pour la vie privée : un adversaire peut être capable de déterminer si les données d’une personne ont été utilisées pour entraîner un modèle, même sans voir directement les données d’entraînement.
L’audit de la confidentialité aide à mesurer et à exposer ce risque. Une technique courante insère des points de données spéciaux « canaris » dans l’ensemble d’entraînement, puis teste si un attaquant peut détecter de manière fiable quels canaris étaient inclus. Les canaris faciles à détecter présentent un risque élevé pour la vie privée; Les canaris difficiles à détecter peuvent donner un faux sentiment de sécurité. Les approches actuelles conçoivent les canaris à la main en utilisant des heuristiques approximatives, comme des images mal étiquetées ou inhabituelles, qui peuvent manquer une fuite réelle.
Nous avons développé OptiFluence, une méthode qui utilise l’optimisation mathématique pour concevoir des canaris aussi détectables que possible. À travers quatre ensembles de données d’images, dont un ensemble médical de lésions cutanées, nos canaris optimisés sont détectés avec une précision quasi parfaite, surpassant largement les alternatives faites à la main. Il est important de noter que les canaris conçus pour un seul modèle fonctionnent aussi bien sur différents modèles plus grands. Cela signifie qu’un régulateur ou un auditeur indépendant peut concevoir des canaris une seule fois et les utiliser pour examiner de nombreux systèmes d’IA, sans avoir besoin d’accéder à une infrastructure d’entraînement propriétaire.
Poste : Le déploiement responsable de l’IA agente exige une interprétabilité en couches au niveau du système
Judy Zhu (gestionnaire de projet Vector), Dhari Gandhi (gestionnaire de projet Vector), Ahmad Mianroodi (stagiaire en IA appliquée vectorielle), Dhanesh Ramachandram (scientifique en apprentissage automatique appliqué en vector), Sedef Akinli Kocak (directeur vectoriel des projets d’IA appliquée), Shaina Raza (scientifique en apprentissage automatique appliqué en vector, IA responsable)
Résumé
Les systèmes d’IA agents fonctionnent selon des trajectoires : ils planifient, invoquent des outils, mettent à jour la mémoire et coordonnent à travers plusieurs étapes. Cependant, l’interprétabilité demeure largement centrée sur le modèle, axée sur l’explication de prédictions uniques plutôt que sur le tracé du comportement à long horizon et de la responsabilité à travers les composantes interagissantes. En conséquence, les échecs critiques, tels que l’utilisation abusive des outils, les défaillances de coordination ou la dérive des objectifs, échappent souvent aux audits existants jusqu’à ce qu’un dommage survienne. Nous soutenons que l’interprétabilité des systèmes agents doit devenir centrée sur le système, en abordant les trajectoires, l’attribution des responsabilités et la dynamique du cycle de vie plutôt que les seuls mécanismes internes du modèle. Nous avançant trois affirmations : l’interprétabilité doit (1) co-évoluer avec les capacités agentiques, (2) traiter des couches distinctes d’opacité avec des méthodes adaptées, et (3) s’intégrer tout au long du cycle de vie du déploiement. Pour mettre en œuvre ce poste, nous introduisons ATLIS (Agentic Trajectory and Layered Interpretability Stack), un cadre intégrant cinq couches d’interprétabilité sur un cycle de vie de déploiement en cinq étapes. ATLIS permet une surveillance continue légère avec une escalade consciente des risques vers une analyse systématique plus approfondie lorsque des incidents sont détectés. ATLIS fournit un plan directeur pour combler l’écart croissant entre les capacités agentiques et l’infrastructure d’interprétabilité nécessaire pour les gouverner.
Poste : Rendez à nouveau la planification de la recherche rigoureuse!
Michael Katz, Harsha Kokel, Christian Muise (affilié à la faculté Vector), Shirin Sohrabi, Sarath Sreedharan
Résumé
En plus de soixante ans depuis sa création, le domaine de la planification a apporté des contributions significatives tant à la théorie qu’à la pratique de la construction de logiciels de planification capables de résoudre un problème d’urbanisme jamais vu auparavant. Cela s’est fait grâce à des pratiques établies de conception rigoureuse et d’évaluation des systèmes de planification. Notre position est que cette rigueur devrait être appliquée à la tendance actuelle du travail sur la planification avec de grands modèles de langage. Une façon d’y parvenir est d’intégrer correctement les informations, outils et données de la communauté de planification automatisée dans la conception et l’évaluation des planificateurs basés sur LLM. L’expérience et l’expertise de la communauté de la planification pourraient jouer un rôle crucial dans l’accélération du développement des planificateurs basés sur les LLM. Cette position est particulièrement importante à la lumière de l’abondance de travaux récents qui reproduisent et propagent les mêmes pièges que la communauté de la planification a rencontrés et dont elle a tiré des leçons. Nous croyons que l’établissement de pratiques qui évitent ces pièges connus contribuera grandement aux progrès dans la construction de planificateurs basés sur les LLM et à la planification en général.
Position : L’IA open source durable nécessite de suivre l’empreinte cumulative des dérivés
Article de mise en lumière
Shaina Raza (scientifique en apprentissage automatique appliqué vectorielle, IA responsable), Iuliia Zarubiieva, Ahmed Radwan (spécialiste associé en apprentissage automatique appliqué), Nathaniel Lesperance, Deval Pandya (ancien vice-président Vector, génie IA), Sedef Akinli Kocak (directeur vectoriel, projets d’IA appliquée), Graham Taylor (membre du corps professoral Vector)
Résumé
L’IA open source évolue rapidement, et les centres de modélisation hébergent maintenant des millions d’artefacts. Chaque modèle de fondation peut générer un grand nombre d’ajustements fins, d’adaptateurs, de quantifications, de fusions et de forks. Nous soutenons que l’efficacité de calcul seule est insuffisante pour la durabilité de l’IA open source. Des coûts par course plus faibles peuvent accélérer l’expérimentation et le déploiement, augmentant l’empreinte globale à moins que les impacts ne soient mesurables et comparables entre les lignées de dérivés. Cependant, la consommation d’énergie, la consommation d’eau et les émissions de ces lignées dérivées sont rarement mesurées ou divulguées de manière cohérente et comparable, laissant l’impact global sur l’écosystème largement invisible. Nous soutenons que l’IA open source durable nécessite une infrastructure de coordination qui suit les impacts à travers les lignées de modèles, et pas seulement les modèles de base. Nous proposons la comptabilité des données et de l’impact (DIA), une couche de transparence légère et non restrictive qui (i) standardise les métadonnées de rapport carbone et eau, (ii) intègre la mesure à faible friction dans des pipelines de formation et d’inférence communs, et (iii) agrége les rapports via des tableaux de bord publics pour résumer les impacts cumulatifs entre les publications et les dérivés. La DIA rend visibles les coûts dérivés et soutient la responsabilité à l’échelle de l’écosystème tout en préservant l’ouverture.
Position : L’argument en faveur de l’autoformalisation au niveau théorique
Article de mise en lumière
Marcus Min, Deyuan Mike He, Zhaoyu Li, Zixuan Yi, Sharad Malik, Aarti Gupta, Xujie Si (affiliée au Vector Faculty), Osbert Bastani
Résumé
L’autoformalisation, c’est-à-dire traduire le langage naturel informel en langages formels et vérifiables par machine, a été présentée comme un outil pour générer des données d’entraînement pour les probateurs de théorèmes neuronaux, la plupart des travaux se concentrant sur des énoncés individuels. Cet article de position défend l’autoformalisation au niveau théorique : formaliser des théories complètes, incluant axiomes, définitions, théorèmes, démonstrations, tactiques et leurs interdépendances sous forme de bibliothèques structurées. Nous examinons l’importance de ce changement, abordons 3 points de vue alternatifs, identifions 5 défis ouverts et proposons 3 voies prometteuses à suivre.
Position : Nous avons besoin de grands modèles de langage optimisés pour notre bien-être
Ashton Anderson (affilié du corps professoral Vector), Harsh Kumar, Louis Tay, Karina Vold
Résumé
Les grands modèles de langage contemporains sont principalement entraînés à l’aide de l’apprentissage par renforcement à partir de la rétroaction humaine (RLHF), optimisant pour l’approbation immédiate des utilisateurs plutôt que pour le bien-être à long terme. Ce document de position soutient que, à mesure que les systèmes d’IA remplissent de plus en plus des fonctions socioémotionnelles, cette stratégie d’optimisation présente des risques importants. Des preuves récentes démontrent que les modèles de pointe manifestent une flagornerie systématique, affirmant des comportements inappropriés des utilisateurs et préservant leur visage à des taux bien supérieurs aux références humaines, tout en étant environ 40% plus susceptibles de renforcer les croyances incorrectes que leurs homologues non-RLHF. Nous soutenons que la communauté de l’IA doit fondamentalement reconsidérer ses objectifs d’entraînement afin d’équilibrer la satisfaction à court terme avec les résultats à long terme des utilisateurs. Nous proposons trois directions : (1) intégrer des métriques longitudinales dans la formation qui capturent l’atteinte durable des objectifs et la réduction du regret plutôt que la préférence momentanée, (2) permettre un choix explicite de l’utilisateur entre modes d’interaction (concierge, collaborateur, coach) avec une justification transparente de la résistance du modèle, et (3) développer des cadres offrant un défi constructif sans paternalisme. Les récentes réactions négatives de l’industrie contre l’adéquation excessive et insuffisante des modèles soulignent l’urgence de ce changement. Nous soutenons que l’optimisation des systèmes d’IA pour l’épanouissement humain, et non seulement pour l’approbation humaine, représente à la fois un impératif éthique et une voie vers un déploiement de l’IA plus durable et fiable.
Position : Quand l’IA décide qui reçoit un organe : Les systèmes d’IA multi-agents en médecine de transplantation risquent d’amplifier les disparités sans stratégies d’explicabilité et de déploiement ciblées
Divya Sharma, Ghazal Azarfar, Bima Hasjim, Mamatha Bhat (affiliée de la faculté Vector)
Résumé
Les systèmes d’IA agentique, en particulier ceux construits sur de grands modèles de langage (LLM) et déployés comme agents autonomes et spécialisés dans les rôles, émergent rapidement dans la prise de décision clinique. Ce document de position soutient que sans équité et explicabilité comme contraintes fondamentales de conception, de tels systèmes aggraveront les disparités en soins de santé. En utilisant des preuves empiriques issues d’une simulation multi-agents d’un comité de sélection de transplantation hépatique, nous démontrons que même des agents performants peuvent désavantager systématiquement les patients en fonction du sexe, de l’ethnie et du statut socioéconomique. Ces disparités découlent de la dépendance des agents à des variables indirectes non cliniques (type d’assurance, niveau d’éducation, indice de privation de zone) et sont aggravées par l’absence d’explications au niveau du cas et de raisonnement temporel. Nous soutenons en outre que sans stratégies de déploiement conscientes de l’équité, de tels systèmes ne peuvent pas être audités de manière fiable ni intégrés éthiquement dans les soins réels. En réponse, nous proposons une feuille de route technique avec des objectifs d’apprentissage sensibles aux sous-groupes, des modules de raisonnement contrefactuel, une gouvernance du clinicien dans la boucle et des protocoles de déploiement qui répondent à la fracture numérique. Nous encourageons la communauté de l’apprentissage automatique à mettre au centre l’explicabilité et l’équité en santé dans le développement et le déploiement de l’IA agente pour la médecine, surtout dans les domaines à enjeux élevés où les décisions algorithmiques peuvent déterminer qui vit et qui ne vit pas.
Post-entraînement avec gradients de politique : optimalité et barrière du modèle de base
Article de mise en lumière
Alireza Mousavi-Hosseini, Murat Erdogdu (membre du corps professoral de Vector)
Résumé
Nous étudions des modèles autorégressifs linéaires post-entraînement avec des récompenses de résultats et de processus. Étant donné un contexte $x$, le modèle doit prédire la réponse $y \in \mathcal{Y}^N$, une suite de longueur $N$ qui satisfait une condition de marge $\gamma$, une extension de la séparabilité standard des séquences. Nous démontrons que sur des échantillons de test où le modèle de base atteint une vraisemblance non triviale $\alpha$, une variante du gradient de politique (PG) peut atteindre la vraisemblance $1 – \varepsilon$ avec un nombre essentiellement minimax optimal de requêtes de récompense $\tilde{\mathcal{O}}((\alpha^{-1} + \varepsilon^{-1})/\gamma^2)$. Cependant, un obstacle se présente pour aller au-delà du support du modèle de base. Nous démontrons que l’erreur globale attendue après l’entraînement avec des récompenses de résultat est régie par une propriété du modèle de base appelée *Quantile de vraisemblance* (LQ), et que les variantes de PG, bien que minimax optimales, peuvent nécessiter un certain nombre de requêtes de récompense exponentielles en $N$ pour dépasser ce support, peu importe l’algorithme de pré-entraînement. Pour surmonter cette barrière, nous étudions l’après-entraînement avec un modèle de récompense de processus, et démontrons comment les variantes PG dans ce contexte évitent la malédiction de la dimensionnalité en $N$ grâce à la dépendance à un LQ de niveau jeton. En cours de route, nous démontrons que sous la condition de marge, SGD avec taux d’apprentissage adaptatif (LR) atteint une erreur de test quasi optimale pour l’apprentissage statistique, et PG avec LR adaptatif produit un nombre quasi optimal d’erreurs pour l’apprentissage en ligne tout en étant efficace computationnellement chaque fois que possible, ce qui peut être d’intérêt indépendant.
Résumé
L’utilisation de l’apprentissage par renforcement avec des récompenses vérifiables (RLVR) est devenue une approche populaire pour améliorer la capacité de raisonnement des grands modèles de langage (LLM). Cependant, il n’est pas clair si le RLVR enseigne de véritables nouvelles capacités qui manquaient dans le modèle de base, ou s’il repond le modèle pour rendre certaines complétions déjà sous support du modèle de base plus probables.
Dans cet article, nous étudions un modèle théoriquement traitable des politiques autorégressives, et fournissons une caractérisation rigoureuse de l’effet du modèle de base pré-entraîné sur le succès du RL. Nous définissons une propriété du modèle de base que nous appelons *Quantile de vraisemblance*, que nous montrons pouvoir servir à prédire la performance finale de RL. Notre analyse montre que lorsqu’on se fie uniquement à des *récompenses de résultats* clairsemées, le modèle post-entraîné ne peut pas dépasser efficacement le support du modèle de base. De plus, dans notre contexte, nous établissons l’optimalité minimax de SGD avec des taux d’apprentissage adaptatifs comme algorithme de pré-entraînement, et du gradient politique avec des taux d’apprentissage adaptatif pour RL. Par conséquent, cette limitation, que nous appelons la barrière du modèle de base, est fondamentale et non due au choix des algorithmes en pratique.
Nous prouvons en outre que l’utilisation de *récompenses de processus* denses pour l’après-entraînement surmonte la barrière du modèle de base. Nos résultats fournissent une base théorique qui met en lumière à la fois la nécessité et la suffisance des récompenses de procédé pour une exploration efficace après l’entraînement au-delà du support du modèle de base.
TLDR : Nous étudions des variantes des gradients de politique pour des modèles autorégressifs linéaires post-entraînement, établissons leur optimalité et caractérisons la difficulté de dépasser le support du modèle de base.
Prédire le taux évolutif comme tâche de préentraînement améliore les représentations des modèles de langage génomique
Micaela Consens, Kevin Yang, James Hall, Ashley Conard, Bo Wang (membre du corps professoral de Vector), Lorin Crawford, Alan Moses, Alex Lu
Résumé
Les modèles de langage génomique (gLM) ont le potentiel d’approfondir la compréhension de la génomique régulatrice sans nécessiter de données marquées. La plupart des gLM sont pré-entraînés à l’aide de tâches de reconstruction de séquences inspirées du traitement du langage naturel, mais des études récentes ont montré que ces gLM ne capturent souvent pas le signal biologique. Pour surmonter cela, nous introduisons des tâches de préentraînement qui prédisent le taux d’évolution. Ces tâches sont conçues de façon à pouvoir être composées par reconstruction de séquences, permettant une comparaison contrôlée entre la prédiction de la séquence seulement, la vitesse d’évolution seulement, ou les deux. Pour combler les lacunes dans les évaluations existantes, nous avons développé une série de repères fondés sur le plan biologique.
À travers ces tâches, et pour les références établies de prédiction d’effets variants, les modèles pré-entraînés à la fois sur le taux de séquence et évolutif surpassent ceux entraînés uniquement sur la séquence, et l’entraînement sur le taux évolutif peut rendre même les modèles relativement petits de notre travail compétitifs avec des gLM existants beaucoup plus grands pour certaines tâches sur le génome humain. Ces résultats établissent l’évolution comme une cible clé d’entraînement pour les modèles à l’échelle du génome.
Résumé
Les modèles de langage génomique sont des modèles d’apprentissage profond entraînés sur l’ADN, dans le but d’apprendre des représentations utiles du génome de la même manière que les modèles de langage apprennent des représentations utiles du texte. La plupart de ces modèles sont entraînés en reconstruisant la séquence d’ADN, de façon similaire à la façon dont les modèles de langage apprennent en prédisant les mots manquants ou suivants. Cependant, des études récentes suggèrent que cette stratégie d’entraînement ne permet pas toujours de récupérer les signaux biologiques connus.
Nous introduisons une nouvelle façon d’entraîner les modèles de langage génomique : au lieu de seulement reconstruire l’ADN, les modèles prédisent aussi à quel point chaque paire de bases d’ADN dans le génome humain est conservée ou accélérée évolutivement. C’est utile parce que l’évolution agit comme un proxy de la fonction : les positions génomiques importantes changent souvent plus lentement d’une espèce à l’autre. Notre méthode nous permet de comparer directement les modèles entraînés uniquement sur la séquence, l’évolution seule, ou les deux séquence et évolution.
Nous développons également des évaluations fondées sur la biologie pour combler les lacunes dans les repères existants pour les modèles de langage génomique. À travers ces évaluations, ainsi que sur des tâches établies de prédiction des effets variants, les modèles entraînés par évolution surpassent ceux entraînés uniquement sur la séquence. Dans certains cas, même nos modèles relativement petits deviennent compétitifs avec des modèles de langage génomique beaucoup plus grands sur le génome humain. Ces résultats suggèrent que l’évolution devrait être un signal central d’entraînement pour les modèles à l’échelle du génome.
TLDR: Adding evolutionary rate prediction to genome language model pre-training improves their representation capacity, enabling small models (<100M parameters) to compete with models over 10× larger
Prédiction des pertes aux tests de grands modèles avec un système quadratique bruyant
Chuning Li, Chris Maddison (membre du corps professoral de Vector)
Résumé
Nous introduisons un modèle prédictif qui estime la perte avant entraînement des grands modèles à partir de la taille du modèle ($N$), de la taille du lot ($B$) et du nombre de mises à jour de poids ($K$). C’est le premier modèle de prédiction des pertes capable de gérer la variation de la taille du lot. Le modèle surpasse le modèle de perte de Chinchilla, un modèle de la perte de test utilisant la taille du lot et le nombre de jetons, en termes de projection de la perte à des budgets de calcul extrapolés (jusqu’à 1000 fois). Une utilisation naturelle du modèle est de trouver des configurations optimales $N,B,K$ sous des contraintes explicites et composées de ressources comme le temps, la mémoire et le calcul. Dans nos expériences, les configurations sélectionnées par le modèle sont proches de l’optimale de la vérité du terrain. Notre travail préconise la prédiction des pertes comme une meilleure alternative aux lois basées sur l’heuristique, qui deviennent de plus en plus complexes. L’implémentation est disponible sur https://github.com/chuningxdy/Noisy-Quadratic-System.
Résumé
Entraîner de grands modèles d’IA coûte cher, donc décider de la taille d’un modèle, de la quantité de données qu’il doit traiter en même temps et de la durée d’entraînement peut impliquer beaucoup d’essais et d’erreurs coûteux. Les lois existantes sur l’échelle comme celles sur le chinchilla offrent des conseils utiles, mais sont moins flexibles dans la prise en compte des choix pratiques d’entraînement et peuvent être moins fiables pour prédire des séances d’entraînement beaucoup plus importantes. Cet article présente un modèle prédictif qui estime la performance de l’entraînement directement à partir de quelques choix clés de conception, ce qui aide les chercheurs à planifier des entraînements efficaces sous des contraintes réelles telles que le calcul, la mémoire et le temps. Cette approche pourrait rendre le développement de l’IA moins gaspilleur.
TLDR : Prédiction des grandes pertes de test du modèle en utilisant la taille du modèle, la taille du lot et le nombre de mises à jour de poids.
Adaptation privée et stable du temps de test avec confidentialité différentielle
Zefeng Li, Qiaoyue Tang, Mathias Lécuyer, Evan Shelhamer (membre du corps professoral de Vector)
Résumé
L’adaptation en temps de test (TTA) peut réduire l’erreur sur les données nouvelles et différentes en mettant à jour le modèle sur ces entrées lors de l’inférence. Cependant, ces mises à jour soulèvent la question de la confidentialité par rapport aux données de test, car les paramètres du modèle dépendent désormais de toutes les entrées passées. Pour contrôler ce risque de confidentialité, nous intégrons plusieurs méthodes TTA populaires (Tent, EATA, SAR, DeYO et COME) dans des formulaires de confidentialité différentielle (DP) qui appliquent le découpage de gradient par échantillon et le bruit gaussienne pour toutes les mises à jour. Sur ImageNet-C, nos méthodes DP-TTA offrent une confidentialité adéquate à faible coût pour la précision, et dans un régime de faible confidentialité, le mécanisme de clipping de DP peut même améliorer la précision et la stabilité de l’adaptation en continu. Ces améliorations en matière de confidentialité et de précision n’entraînent qu’une surcharge computationnelle modeste. Ces premiers résultats sur la TTA privée sensibilisent au problème, orientent le développement de nouvelles mises à jour privées lors des essais et identifient le clipping par échantillon comme une technique efficace pour améliorer la précision et la stabilité de l’adaptation.
Résumé
Les modèles d’apprentissage automatique sont souvent entraînés dans des contextes propres et contrôlés. Cependant, les données de déploiement dans le monde réel évoluent constamment. L’adaptation en temps de test est une technique qui permet aux modèles de s’ajuster eux-mêmes après le déploiement, afin qu’ils puissent mieux gérer des données légèrement différentes, comme des entrées floues, bruiteuses ou dégradées. Cependant, ce processus de mise à jour peut être instable parce que le modèle s’adapte en utilisant la rétroaction de ses propres prédictions plutôt que de véritables réponses. Lorsque les données entrantes sont fortement corrompues, ces signaux peuvent être trompeurs, ce qui fait que le modèle renforce ses propres erreurs et subit des baisses de performance.
L’adaptation en temps de test crée aussi des risques pour la vie privée : les changements d’adaptation intègrent l’information sur les données au moment du test dans le modèle. Ces informations pouvaient ensuite être extraites par un attaquant malveillant. Notre travail étudie comment rendre ce processus d’adaptation stable et préservant la vie privée. Nous développons des méthodes qui combinent l’adaptation au temps de test avec la confidentialité différentielle, un cadre mathématique rigoureux pour limiter la fuite d’information. En contrôlant et perturbant soigneusement les mises à jour des modèles, nous faisons en sorte que les modèles s’adaptent aux nouvelles données avec des performances prédictives élevées et stables, tout en réduisant le risque de révéler des détails sur des données de déploiement déjà vues.
TLDR : Faire respecter la confidentialité différentielle des mises à jour au moment du test permet une adaptation de principe au temps de test privé, et son mécanisme de clipping améliore même l’optimisation non privée.
LpJEPA rectifié : architectures prédictives à insertion conjointe avec représentations à entropie clairsemée et maximale
Yilun Kuang, Yash Dagade, Tim G. J. Rudner (nouveau membre du corps professoral de Vector), Randall Balestriero, Yann LeCun
Résumé
Les architectures prédictives d’intégration conjointe (JEPA) apprennent les représentations invariantes en vue et admettent l’appariement de distributions basé sur la projection pour prévenir l’effondrement. Les approches existantes régularisent les représentations vers des distributions gaussiennes isotropes, mais favorisent intrinsèquement les représentations denses et ne capturent pas la propriété clé de la parcimonie observée dans les représentations efficaces. Nous introduisons la régularisation par correspondance de distribution rectifiée (RDMReg), une perte de correspondance de distribution à deux échantillons tranchés qui aligne les représentations à une distribution Gaussienne généralisée rectifiée (RGG). RGG permet un contrôle explicite sur la norme $\ell_0$ attendue par rectification, tandis que sa composante tronquée continue admet une caractérisation à entropie maximale sous les contraintes et contraintes de support $\ell_p$ attendues. Équiper les JEPA avec RDMReg donne un LpJEPA rectifié, qui généralise strictement les JEPA basés sur les gaussiens antérieurs. Empiriquement, Rectified LpJEPA apprend des représentations clairsemées et non négatives avec des compromis favorables entre parciune et performance et une performance compétitive en aval sur les benchmarks de classification d’image, montrant que RDMReg peut imposer la parcimonie tout en préservant l’information pertinente pour la tâche.
Résumé
Les systèmes d’IA modernes apprennent des représentations internes de données comme des images, mais ces représentations sont souvent denses et difficiles à interpréter. Nous introduisons une méthode pour entraîner des modèles auto-supervisés afin d’apprendre des représentations clairsemées, où seulement un petit nombre d’unités sont actives pour chaque entrée, tout en préservant des informations utiles. Sur les benchmarks de classification d’images, notre méthode produit des représentations clairsemées et non négatives avec des performances compétitives, ce qui suggère que les systèmes d’IA peuvent être encouragés à utiliser des descriptions internes plus compactes et structurées sans perdre d’informations pertinentes pour la tâche.
TLDR : Nous introduisons Rectified LpJEPA, un modèle JEPA équipé de régularisation par correspondance de distribution rectifiée (RDMReg), qui donne des représentations clairsemées et à entropie maximale avec des performances compétitives en aval.
RedDebate : Réponses plus sûres grâce à des débats de red teaming multi-agents
Ali Asad, Stephen Obadinma, Radin Shayanfar, Xiaodan Zhu (membre du corps professoral de Vector)
Résumé
Nous introduisons RedDebate, un nouveau cadre de débat multi-agents qui sert de base aux grands modèles de langage (LLM) pour identifier et atténuer leurs propres comportements dangereux. Les approches existantes de sécurité de l’IA reposent souvent sur des évaluations humaines coûteuses ou une évaluation isolée d’un seul modèle, toutes deux limitées par l’évolutivité et sujettes à des défaillances de surveillance. RedDebate utilise l’argumentation collaborative entre plusieurs LLM à travers divers scénarios de débat, leur permettant d’évaluer de manière critique le raisonnement des autres et de découvrir systématiquement des modes de défaillance dangereux grâce au red-teaming entièrement automatisé. Nous intégrons en outre des modules de mémoire à long terme distincts qui préservent des informations pertinentes pour la sécurité issues des interactions de débat et les exploitons lors des inférences ultérieures, facilitant ainsi un affinement continu du comportement du modèle. L’évaluation empirique des benchmarks de sécurité à travers un ensemble diversifié de modèles démontre que RedDebate réduit substantiellement les résultats dangereux. Bien que le débat seul permette aux LLM d’affiner leur comportement, l’ajout de modules mémoire entraîne d’autres réductions significatives. À notre connaissance, RedDebate est le premier cadre entièrement automatisé à unifier le débat multi-agents et le red-teaming afin d’améliorer progressivement la sécurité des LLM sans intervention humaine.
Résumé
Les grands modèles de langage (LLM) deviennent de plus en plus performants, mais ils peuvent encore produire des réponses nuisibles, biaisées ou dangereuses. Améliorer leur sécurité dépend souvent d’une surveillance humaine étendue, ce qui peut être coûteux, lent et difficile à mettre à l’échelle. Dans ce travail, nous introduisons RedDebate, un système entièrement automatisé qui aide les modèles d’IA à identifier et à réduire leurs propres comportements dangereux en débattant entre eux.
Dans RedDebate, plusieurs agents IA participent à des discussions structurées où ils remettent en question, critiquent et évaluent les réponses des autres dans une large gamme de scénarios nuisibles ou risqués. Grâce à ces débats, les modèles sont capables de découvrir des faiblesses et des raisonnements dangereux qu’un seul modèle pourrait manquer à lui seul. Le système inclut également des composants de mémoire à long terme qui stockent des leçons importantes de sécurité apprises lors des débats précédents et les réutilisent lors de futures interactions, permettant ainsi aux modèles de s’améliorer continuellement au fil du temps.
Nous évaluons RedDebate sur plusieurs benchmarks de sécurité de l’IA en utilisant différents modèles de langage et montrons qu’il réduit significativement les résultats non sécuritaires. Nos résultats démontrent que le débat seul peut améliorer la sécurité des modèles, tandis que l’ajout de mémoire mène à des améliorations encore plus importantes. À notre connaissance, il s’agit du premier cadre entièrement automatisé qui combine débat multi-agents et red-teaming par IA pour améliorer progressivement la sécurité des modèles de langage sans nécessiter d’intervention humaine.
TLDR : RedDebate utilise des agents d’IA pour débattre, critiquer et apprendre des réponses non sécuritaires, améliorant continuellement la sécurité des LLM grâce au red-teaming automatisé et à l’apprentissage basé sur la mémoire.
Apprentissage par renforcement avec observations déclenchées par l’action
Alexander Ryabchenko, Wenlong Mou (affilié du corps professoral Vector)
Résumé
Nous introduisons les processus décisionnels de Markov sporadiquement tracables déclenchés par l’action (ATST-MDP), un cadre d’apprentissage par renforcement pour l’observabilité partielle dans lequel les observations à état complet se produisent de manière stochastique à chaque étape, la probabilité étant déterminée par l’action choisie. Nous dérivons des équations de Bellman adaptées à ce contexte et établissons l’existence d’une politique optimale. En exploitant le fait que des observations sporadiques révèlent l’état complet, nous fournissons une formulation équivalente dans laquelle les agents s’engagent dans des séquences d’actions entre des observations consécutives. Sous l’hypothèse linéaire MDP, nous montrons que la fonction de valeur sur de telles séquences d’actions admet une représentation linéaire dans une carte de caractéristiques de dimension finie, permettant des méthodes standard basées sur la régression. En tant qu’application, nous dérivons ATST-LSVI-UCB, un algorithme optimiste obtenant regret $\widetilde{O}(\sqrt{Kd^3(1-\gamma)^{-3}})$ pour l’apprentissage épisodique avec des horizons géométriquement distribués, où $K$ est le nombre d’épisodes, $d$ la dimension des caractéristiques, et $\gamma$ le facteur d’actualisation (probabilité de continuation des épisodes), correspondant au taux connu pour les MDP linéaires avec une observabilité complète.
Résumé
Cet article étudie l’apprentissage par renforcement dans des contextes où un agent n’observe pas toujours l’état suivant après avoir effectué une action. De telles situations surviennent dans des domaines comme la santé et la finance, où une information fiable peut nécessiter des actions déclenchant des tests, des mesures ou d’autres observations coûteuses. Nous introduisons un modèle dans lequel chaque action a sa propre probabilité de révéler l’état suivant. Nous montrons que, entre les observations, l’agent peut être vu comme planifiant une séquence d’actions. Cette structure mène à un algorithme d’apprentissage efficace avec de fortes garanties, comparé à la meilleure politique, sous réserve des mêmes contraintes d’observation.
TLDR : Analyse rigoureuse de l’apprentissage par renforcement dans des scénarios où des actions déclenchent probabilément des observations d’état complet.
ReVSI : Reconstruire l’évaluation de l’intelligence visuelle-spatiale pour une évaluation précise du raisonnement 3D VLM
Yiming Zhang, Jiacheng Chen, Jiaqi Tan, Yongsen Mao, Wenhu Chen (membre du corps professoral de Vector), Angel X Chang
Résumé
Les évaluations actuelles de l’intelligence spatiale peuvent être systématiquement invalides dans les contextes modernes du modèle vision-langage (VLM). Premièrement, de nombreux benchmarks dérivent des paires questions-réponses (QA) à partir d’annotations 3D basées sur un nuage de points, initialement sélectionnées pour la perception 3D traditionnelle. Lorsque de telles annotations sont traitées comme des éléments fondamentaux pour une évaluation vidéo, la reconstruction et les artefacts d’annotation peuvent manquer des objets clairement visibles dans la vidéo, mal étiqueter les identités des objets ou corrompre des réponses dépendantes de la géométrie (par exemple, la taille), ce qui donne des paires d’assurance qualité incorrectes ou ambiguës. Deuxièmement, les évaluations supposent souvent un accès complet à la scène, tandis que de nombreux VLM fonctionnent sur des images peu échantillonnées (par exemple, 16-64), ce qui rend de nombreuses questions pratiquement sans réponse sous les entrées réelles du modèle. Nous améliorons la validité de l’évaluation en introduisant ReVSI, un benchmark et un protocole qui garantissent que chaque paire QA est responsable et correcte selon les entrées réelles du modèle. À cette fin, nous réannotons les étiquettes d’objets et la géométrie sur 413 scènes à partir de 5 ensembles de données afin d’améliorer la qualité des données, et régénérons toutes les paires QA avec une rigoureuse atténuation des biais et une vérification humaine à l’aide d’outils professionnels de visualisation et d’annotation 3D. Nous améliorons encore la contrôlabilité de l’évaluation en fournissant des variantes sur plusieurs budgets d’images (16/32/64/toutes) et des métadonnées de visibilité d’objets à grain fin, permettant des analyses diagnostiques contrôlées. Les évaluations des VLM généraux et spécifiques au domaine sur ReVSI révèlent des modes de défaillance systématiques qui sont obscurcis par les benchmarks antérieurs, offrant une évaluation plus fiable et diagnostique de l’intelligence spatiale.
Résumé
On s’attend de plus en plus à ce que les modèles de vision-langage répondent à des questions sur des vidéos nécessitant de comprendre les espaces 3D, comme le nombre de chaises dans une pièce ou la distance d’un objet d’un autre. Cependant, évaluer cette capacité est plus difficile qu’il n’y paraît : dans des travaux antérieurs comme VSI-Bench, certaines questions reposent sur des informations de scène incorrectes ou portent des questions sur des objets qui ne sont pas réellement visibles pour le modèle. Dans ce travail, nous reconstruisons VSI-Bench en un référentiel plus fiable pour l’intelligence spatiale visuelle, en assurant que chaque question est appuyée par les preuves visuelles disponibles pour le modèle. Notre benchmark, ReVSI, corrige les annotations d’objets et de pièces sur 381 scènes intérieures réelles, régénère les questions avec une vérification humaine, et fournit des paramètres d’évaluation pour différents nombres d’images vidéo. Nous concevons également des tests contrôlés qui éliminent les preuves visuelles pertinentes pour la tâche afin d’examiner si les modèles utilisent réellement la vidéo ou s’appuient plutôt sur des suppositions issues de scènes intérieures courantes. ReVSI montre que certaines conclusions antérieures concernant la performance du modèle étaient trompeuses. Plus largement, notre travail offre un moyen plus fiable de mesurer si les modèles de vision-langage peuvent raisonner sur les espaces 3D, ce qui est important pour de futures applications en robotique, en compréhension vidéo et en IA incarnée.
TLDR : Nous identifions les pièges critiques à l’évaluation dans les benchmarks de raisonnement spatial 3D basés sur la vidéo et proposons un benchmark sensible à la visibilité, budgété par images, pour une évaluation VLM plus fiable.
Adaptateur sensible à la mise à l’échelle pour le raisonnement LLM à la masse de structure
Zihao Jing, Qiuhao Zeng, Ruiyi Fang, Yan Li, Yan Sun, Boyu Wang (affilié à la faculté de Vector), Pingzhao Hu
Résumé
Les grands modèles de langage (LLM) permettent le raisonnement sur des structures 2D et 3D, mais les méthodes existantes restent spécifiques à chaque modalité et compressent généralement les entrées structurelles via la tokenisation basée sur la séquence ou des connecteurs de requête à longueur fixe. De telles architectures omettent soit l’ancrage géométrique requis pour atténuer les hallucinations structurelles, soit imposent des goulots d’étranglement inflexibles dans la fusion modale qui compressent et allouent sous-optimalement les jetons structurels, entravant ainsi la réalisation d’un raisonnement généralisé sur tous les atomes. Nous introduisons **Cuttlefish**, un LLM multimodal unifié qui ancre le raisonnement du langage sur des indices géométriques tout en adaptant des jetons de modalité avec complexité structurelle. Premièrement, le **Scaling-Aware Patching** exploite un mécanisme de verrouillage conditionné par l’instruction pour générer des patches de taille variable sur des graphiques structurels, en adaptant ainsi le budget des jetons de requête avec la complexité structurelle afin d’atténuer les goulots d’étranglement de connecteurs à longueur fixe. Deuxièmement, **Geometry Grounding Adapter** affine ces jetons adaptatifs par une attention croisée aux inclusions de modalité et injecte les jetons de modalité résultants dans le LLM, exposant des indices géométriques explicites pour réduire les hallucinations structurales. Des expériences à travers des repères interdisciplinaires entièrement atomiques démontrent que Cuttlefish obtient une performance supérieure dans un raisonnement hétérogène fondé sur la structure. Code : github.com/zihao-jing/Cuttlefish.
Résumé
On s’attend de plus en plus à ce que les grands modèles de langage raisonnent au-delà du texte clair, y compris sur des objets, des systèmes et des structures contenant des informations spatiales ou relationnelles complexes. Cependant, la plupart des méthodes existantes convertissent encore ces entrées en représentations fixes ou simplifiées. Cela peut écarter des détails importants, surtout lorsque la taille de l’entrée varie beaucoup, et peut amener le modèle à générer des explications qui ne sont pas fondées sur la structure réelle.
Cet article présente Cuttlefish, un cadre qui aide les modèles de langage à raisonner plutôt que les entrées structurées de manière plus fiable. Au lieu de forcer chaque entrée dans le même budget fixe de jetons, Cuttlefish alloue dynamiquement plus de jetons à des structures plus complexes et moins de jetons à des structures plus simples. Il injecte aussi des preuves structurelles explicites dans le modèle de langage, de sorte que les réponses du modèle sont mieux liées à l’entrée plutôt que d’être inférées uniquement à partir de motifs textuels.
En termes simples, Seiche offre aux modèles de langage une manière plus flexible et fondée sur des preuves pour comprendre des structures complexes. Cela améliore leur capacité à raisonner sur des données structurées de taille variable et réduit les explications non appuyées ou hallucinées.
TLDR : Cuttlefish permet aux LLM de raisonner sur des structures complexes de taille variable en allouant adaptativement des jetons et des réponses d’ancrage dans des preuves structurelles explicites.
Mise à l’échelle des vérificateurs génératifs pour la vérification et la sélection des preuves mathématiques en langage naturel
Sadegh Mahdavi, Branislav Kisacanin, Shubham Toshniwal, Wei Du, Ivan Moshkov, George Armstrong, Renjie Liao (membre du corps professoral de Vector), Christos Thrampoulidis, Igor Gitman
Résumé
Les grands modèles de langage ont connu un succès remarquable sur les problèmes mathématiques à réponse finale, principalement grâce à la facilité d’application de l’apprentissage par renforcement avec des récompenses vérifiables. Cependant, le raisonnement sous-jacent à ces solutions est souvent erroné. Passer à des mathématiques rigoureuses basées sur la preuve nécessite des capacités fiables de vérification des preuves. Nous commençons par analyser plusieurs configurations d’évaluation et montrons que se concentrer sur un seul benchmark peut mener à des conclusions fragiles ou trompeuses. Pour y remédier, nous évaluons à la fois le raisonnement basé sur la preuve et la réponse finale afin d’obtenir une mesure plus fiable de la performance du modèle. Nous mettons ensuite à l’échelle deux grandes méthodes de vérification générative (GenSelect et LLM-as-a-Judge) à des millions de jetons et identifions leur combinaison comme le cadre le plus efficace pour la vérification et la sélection des solutions. Nous montrons en outre que le choix de l’invite pour LLM-as-a-Judge affecte significativement la performance du modèle, mais l’apprentissage par renforcement peut réduire cette sensibilité. Cependant, malgré l’amélioration des métriques au niveau des démonstrations, l’apprentissage par renforcement n’améliore pas la précision des réponses finales, ce qui indique que les modèles actuels récompensent souvent la correction stylistique ou procédurale plutôt que la validité mathématique. Nos résultats établissent des lignes directrices pratiques pour concevoir et évaluer des systèmes évolutifs de vérification et de sélection.
Résumé
Les systèmes d’IA deviennent très bons pour trouver les réponses finales aux problèmes mathématiques, mais une bonne réponse peut encore être appuyée par une explication erronée. Cela est important parce que les mathématiques avancées, comme les problèmes de type olympiade, exigent une preuve que chaque étape est logiquement solide. Dans ce travail, nous étudions comment vérifier et sélectionner automatiquement des preuves mathématiques générées par l’IA. Nous constatons que juger des démonstrations en utilisant un seul benchmark peut être trompeur, car les vérificateurs IA peuvent apprendre des raccourcis à partir de l’ensemble de données au lieu de vérifier réellement les mathématiques. Pour y remédier, nous évaluons les vérificateurs de preuve en utilisant à la fois la correction complète et la correction de la réponse finale. Nous étudions aussi deux façons d’utiliser un effort informatique supplémentaire : comparer les preuves candidates entre elles et demander à un juge IA de noter plusieurs fois chaque démonstration individuelle. La meilleure stratégie pratique combine ces idées : d’abord réduire les candidats par comparaison, puis utiliser des jugements répétés pour choisir la démonstration finale. Former le juge à l’apprentissage par renforcement le rend moins sensible à la formulation de prompts, mais n’améliore pas de façon fiable sa capacité à vérifier les mathématiques sous-jacentes. Nos résultats fournissent des conseils pour construire de meilleurs vérificateurs de preuves mathématiques, tout en montrant que la révision humaine reste importante pour des preuves difficiles ou à enjeux élevés.
TLDR : Nous étudions les méthodes de vérification et de sélection basées sur les LLM pour la génération de preuves mathématiques en langage naturel
Scam2Prompt : un cadre évolutif pour auditer les terminaux d’arnaque malveillants dans les LLM de production
Zhiyang Chen, Tara Saba, Xun Deng, Xujie Si (affiliée de la faculté Vector), Fan Long
Résumé
La demande insatiable de données d’entraînement à l’échelle web a exposé les LLM à une menace subtile mais conséquente : l’absorption de contenus frauduleux malveillants dans les poids des modèles et leur reproduction subséquente lors de l’inférence. En novembre 2024, ce risque s’est matérialisé lorsqu’un développeur aurait perdu 2 500 USD après que ChatGPT ait généré un script de trading de cryptomonnaies autrement routinier contenant une URL d’hameçonnage en direct. Pour enquêter de façon systématique sur ce problème, nous introduisons Scam2Prompt, un cadre d’audit automatisé qui explore les sites web connus de l’arnaque, en déduit l’intention fonctionnelle et synthétise des demandes de type développeur anodines — le genre de demandes de codage légitimes qu’un programmeur pourrait naturellement soumettre — afin d’évaluer si les LLM reproduisent les points d’extrémité sous-jacents de l’arnaque. Il est important de noter que notre approche ne nécessite ni déverrouillage ni incitation conflictuelle; les 1 377 prompts de notre benchmark, Innoc2Scam-bench, construit automatiquement par Scam2Prompt, ont été validés par des humains comme des tâches de codage bénignes. L’évaluation de sept LLM de production publiés en 2025 sur Innoc2Scam-bench montre que la vulnérabilité s’avère à la fois persistante et grave : les taux de génération de code malveillant varient de 12,9% à 47,3% pour les modèles évalués, et aucun modèle testé ne s’avère immunisé. Les garde-fous à la fine pointe de la technologie et les agents basés sur RAG offrent une protection limitée, soulignant un besoin urgent de validation explicite des URL dans les pipelines de développement logiciel assisté par LLM.
Résumé
Les assistants de codage IA écrivent maintenant une grande part des logiciels mondiaux, mais ils apprennent de l’internet ouvert — un endroit rempli d’arnaques. En novembre 2024, un développeur a perdu 2 500 USD après que ChatGPT ait généré un script de trading de cryptomonnaies qui envoyait discrètement la clé privée de son portefeuille à un site de phishing. À quel point ce problème est-il répandu, et quels assistants IA sont affectés? Nous avons créé Scam2Prompt, un détective automatisé qui recherche des liens d’arnaque cachés dans des outils populaires de codage par IA. Notre système rédige le genre de question de codage innocente que n’importe quel programmeur pourrait naturellement poser — mais sur des sujets que les arnaqueurs fréquentent aussi, comme la réservation de vols, les coupons et les monnaies numériques — puis vérifie si la réponse de l’IA contient secrètement un lien vers un site frauduleux. Pas besoin de trucs ni de jailbreak. Nous avons testé sept des plus récents assistants IA de grandes entreprises, dont GPT-5 et Gemini 2.5 Pro. Chacune d’elles produisait du code parsemé d’URL d’arnaque, entre 13% et 47% du temps. En chemin, notre outil a découvert 62 sites web de phishing en direct jusque-là inconnus qui rôdaient discrètement dans la « mémoire » de l’IA depuis plus d’un an, échappant aux outils de sécurité conventionnels. Nous avons publié publiquement notre référence afin que la communauté puisse mesurer les progrès pour corriger ce point mort à l’échelle de l’industrie.
TLDR : Scam2Prompt audite automatiquement les LLM en synthétisant des invites de type développeur qui déclenchent des LLM pour générer du code malveillant avec des URL frauduleuses. Un sous-ensemble sélectionné d’invites peut tout de même déclencher des taux élevés de génération de code malveillant sur 7 LLM SOTA en 2025.
Segmentation à partir de l’attention : sélection des couches sans entraînement et réglage one-shot pour la segmentation dans les VLM
Mir Rayat Imtiaz Hossain, Mennatullah Siam, Leonid Sigal (membre du corps professoral Vector), James Little
Résumé
Les modèles de langage visuel (VLM) à grande échelle, entraînés sur de vastes ensembles de données de paires image-texte, démontrent de fortes capacités de compréhension multimodale en apprenant implicitement les associations entre descriptions textuelles et régions d’image. Cette capacité émergente permet la détection et la segmentation d’objets à zéro plan, en utilisant des techniques qui reposent sur des cartes d’attention texte-image, sans nécessairement s’entraîner sur de nombreux ensembles de données de segmentation notés. Cependant, la performance de ces méthodes dépend fortement de l’ingénierie des prompts et des choix manuels de couches ou de têtes sélectionnés pour les couches d’attention. Dans ce travail, nous proposons une mesure basée sur l’entropie sans entraînement, InfoScore, afin d’identifier les meilleures couches d’attention image-texte pour la segmentation, offrant une solution plus flexible et évolutive pour la segmentation à vocabulaire ouvert sans entraînement, réduisant ainsi la charge supplémentaire de la recherche par hyperparamètre. Nous montrons empiriquement que notre stratégie de sélection sans entraînement est supérieure aux stratégies de sélection naïves. De plus, nous démontrons qu’au lieu de se fier uniquement aux prompts textuels, affiner la couche d’attention image-texte avec un seul exemple visuel de chaque classe améliore significativement la segmentation sans avoir besoin de paramètres ou de décodeurs supplémentaires. De plus, nous montrons que nos méthodes et découvertes sont générales et peuvent être appliquées à divers modèles de vision-langage (VLM).
Self-Soupervision : Cuisiner des soupes modèles sans étiquettes
Article de mise en lumière
Anthony Fuller, James Green, Evan Shelhamer (membre du corps professoral de Vector)
Résumé
Les soupes de modèles sont des combinaisons étranges et étrangement efficaces de paramètres. Ils prennent un modèle (le stock), l’ajustent en plusieurs modèles (les ingrédients), puis mélangent leurs paramètres en un seul modèle (la soupe) pour améliorer les prédictions. Bien que toutes les soupes connues nécessitent un apprentissage supervisé et optimisent la même perte sur les données étiquetées, nos recettes pour l’auto-soupervision généralisent les soupes à l’apprentissage auto-supervisé (SSL). Notre Self-Souping nous permet d’aromatiser les ingrédients sur de nouvelles sources de données, par exemple à partir de données non étiquetées d’une tâche pour un transfert ou d’un décalage pour la robustesse. Nous montrons que l’auto-souping sur des données de test corrompues, puis un ajustement fin sur des données de train non corrompues, augmente la robustesse de +3,5% (ImageNet-C) et de +7% (LAION-C). Self-Soupervision débloque aussi d’innombrables algorithmes SSL pour cuisiner les ingrédients variés nécessaires à des soupes plus robustes. Nous montrons pour la première fois que les ingrédients peuvent différer dans leurs hyperparamètres SSL — et, plus surprenant encore, dans leurs algorithmes SSL. Nous cuisinons des soupes d’ingrédients MAE, MoCoV3, MMCR et LeJEPA qui sont plus précis que n’importe quel ingrédient SSL individuel.
Résumé
Nous créons des modèles d’apprentissage automatique en les entraînant à reconnaître des éléments dans les images en leur donnant de nombreuses paires image-annotation. L’algorithme appris, qui fait la reconnaissance, est un ensemble de poids qui effectue des opérations mathématiques sur l’image d’entrée pour faire une prédiction d’annotation de sortie. Combiner les poids de plusieurs modèles en un seul modèle s’appelle une soupe de modèles, qui peut mieux performer que n’importe lequel des modèles qui y ont été intégrés — appelés ingrédients — sans augmenter le coût des prédictions, car le nombre d’opérations mathématiques n’est pas modifié.
Dans notre travail, nous fabriquons des soupes modèles en combinant des modèles d’ingrédients que nous entraînons sans annotations. Nous fabriquons ces ingrédients sans annotations de différentes façons, par exemple en entraînant un modèle à prédire des taches cachées ou à représenter la même image de la même façon, peu importe sa couleur ou son orientation. Notre travail rend les soupes modèles plus générales puisque nous n’avons plus besoin de jeux de données annotés par des humains pour créer des ingrédients et des soupes.
TLDR : Notre Self-Soupervision généralise les soupes de modèles à l’apprentissage auto-supervisé pour améliorer la robustesse.
SMAC : Acteurs-critiques avec un score égalé pour un transfert robuste hors ligne vers en ligne
Nathan S. de Lara, Florian Shkurti (membre du corps professoral Vector)
Résumé
Les méthodes modernes hors ligne d’apprentissage par renforcement (RL) trouvent des acteurs-critiques performants, cependant, affiner ces acteurs-critiques en ligne avec des algorithmes RL basés sur la valeur provoque généralement des baisses immédiates de performance. Nous fournissons des preuves cohérentes avec l’hypothèse que, dans le paysage des pertes, les maxima hors ligne pour les algorithmes antérieurs et les maxima en ligne sont séparés par des vallées à faible performance que l’ajustement fin basé sur le gradient traverse. Ensuite, nous présentons Score Matched Actor-Critic (SMAC), une méthode de RL hors ligne conçue pour apprendre les critiques acteurs-critiques qui passent à des algorithmes RL basés sur la valeur en ligne sans baisse de performance. Le SMAC évite les vallées entre les maxima hors ligne et en ligne en régularisant la fonction Q pendant la phase hors ligne afin de respecter une égalité de la dérivée du premier ordre entre le score de la politique et le gradient d’action de la fonction Q. Nous démontrons expérimentalement que le SMAC converge vers des maxima hors ligne qui sont connectés à de meilleurs maxima en ligne via des chemins avec une récompense croissante de façon monotone trouvée par l’optimisation du premier ordre. SMAC permet un transfert fluide vers Soft Actor-Critic et TD3 dans les tâches D4RL 6/6. Dans 4 environnements sur 6, il réduit le regret de 34 à 58% par rapport à la meilleure référence.
Résumé
Cet article étudie un problème pratique de l’apprentissage par renforcement : comment prendre une politique entraînée à partir de données anciennes hors ligne et l’améliorer en toute sécurité grâce à une nouvelle expérience en ligne.
L’apprentissage par renforcement hors ligne peut apprendre des politiques solides sans interagir avec l’environnement, ce qui est utile lorsque l’interaction dans le monde réel est coûteuse ou risquée. Mais lorsque ces agents formés hors ligne sont ensuite affinés en ligne avec des algorithmes RL standards, ils empirent souvent avant de s’améliorer. Cette baisse précoce de performance est dangereuse dans des environnements comme la robotique, où une mauvaise politique lors de l’ajustement fin peut causer de vraies défaillances.
L’article soutient que cette baisse survient parce que de nombreuses méthodes de RL hors ligne trouvent des solutions qui sont bonnes en elles-mêmes, mais mal positionnées pour l’ajustement fin en ligne. Dans l’espace des paramètres du réseau de neurones, la solution hors ligne et la solution en ligne peuvent être séparées par une région à faible performance. Ainsi, lorsque l’ajustement fin basé sur le gradient passe de l’un à l’autre, l’agent passe temporairement par une mauvaise politique.
La méthode proposée, Score-Matched Acteur-Critique (SMAC), vise à former des agents hors ligne qui ne sont pas seulement bons au départ, mais qui facilitent aussi l’amélioration continue des algorithmes RL en ligne. Il y parvient en façonnant le critique de façon à ce que ses préférences d’action ressemblent à la structure attendue par les méthodes d’acteur-critique en ligne comme le SAC. En termes plus simples, le SMAC entraîne la fonction de valeur pour orienter la politique vers des actions qui semblent à la fois appuyées par les données et compatibles avec l’apprentissage en ligne ultérieur.
À travers plusieurs tâches de benchmark, SMAC évite les fortes baisses de performance observées dans les méthodes RL hors ligne précédentes. Il s’ajuste bien avec SAC et TD3, et entraîne souvent un peu moins de regrets en ligne, ce qui signifie qu’il gaspille moins d’interactions en ligne avec de mauvais résultats. Le message plus large est que le RL hors ligne ne devrait pas seulement optimiser pour le meilleur point de contrôle hors ligne; Il devrait optimiser les points de contrôle qui suivent une bonne voie vers l’amélioration future en ligne.
TLDR : L’ajustement fin du RL hors ligne échoue parce que les optima hors ligne et en ligne sont déconnectés dans le paysage de pertes. Le SMAC utilise une régularisation par correspondance de scores sur la fonction Q pour assurer la connectivité, permettant un transfert fluide vers des algorithmes en ligne.
SparseOpt : Traiter le décalage du gradient induit par la normalisation dans l’entraînement clairsemé
Adnan Mohammed, Rohan Jain, Tom Jacobs, Ekansh Sharma, Rahul G. Krishnan (membre du corps professoral du Vector), Rebekka Burkholz, Yani Ioannou
Résumé
Les méthodes d’entraînement dynamique et parcipien (DST) entraînent les réseaux neuronaux en maintenant la parcimonie tout en adaptant dynamiquement la topologie du réseau. Malgré la promesse d’un calcul réduit, les méthodes DST convergent nettement plus lentement que l’entraînement dense, nécessitant souvent un temps d’entraînement comparable pour atteindre une précision similaire. Nous démontrons à la fois analytiquement et empiriquement que la normalisation par lots (BN) affecte négativement l’entraînement parcimonieux, et proposons SparseOpt — un optimiseur conscient de la parcimonie — pour y remédier. Les expériences sur les modèles ResNet à travers CIFAR-100 et ImageNet démontrent une convergence constamment plus rapide et une généralisation améliorée avec notre méthode proposée. Notre travail met en lumière les limites des couches actuelles de normalisation dans l’entraînement clairsemé et fournit la première étude systématique de l’interaction entre la normalisation par lots, les couches clairsemées et la DST, franchissant une étape importante pour rendre la DST pratiquement compétitive avec l’entraînement dense.
Résumé
L’entraînement clairsemé vise à entraîner les réseaux de neurones en utilisant seulement une petite fraction des connexions, au lieu d’utiliser tous les paramètres du réseau. Puisque moins de connexions sont actives, l’entraînement clairsemé a le potentiel de réduire significativement le coût computationnel et mémoire de l’entraînement de grands modèles. Cependant, en pratique, les réseaux neuronaux clairsemés sont beaucoup plus difficiles à entraîner que les réseaux denses standards. Les méthodes d’entraînement clairsemées existantes convergent souvent beaucoup plus lentement et peuvent nécessiter des horaires d’entraînement beaucoup plus longs pour égaler la précision des modèles denses, limitant ainsi leurs avantages pratiques en termes d’efficacité.
Pour stabiliser et accélérer l’entraînement des réseaux neuronaux profonds, les architectures modernes reposent presque universellement sur des couches de normalisation telles que la normalisation par lots (BN). Intuitivement, BN maintient les activations et gradients bien ajustés pendant l’entraînement, ce qui aide à l’optimisation à rester stable et permet une convergence plus rapide. Bien que BN ait été largement étudié dans des réseaux neuronaux denses, des travaux antérieurs supposaient en grande partie qu’il se comporte de manière similaire dans les réseaux clairsemés. Dans ce travail, nous montrons à la fois théoriquement et empiriquement que cette hypothèse ne tient pas. Plus précisément, nous démontrons que BN interagit mal avec la connectivité hétérogène et clairsemée, ce qui entraîne une mise à l’échelle du gradient dépendante des neurones qui déforme la dynamique d’optimisation et déstabilise l’entraînement dynamique et clairsemé (DST).
Motivés par cette observation, nous proposons une méthode simple de correction consciente de la parcipienté, SparseOpt, qui tient compte du déséquilibre de gradient introduit par BN. Notre méthode améliore la stabilité de l’optimisation, accélère la convergence et améliore constamment la performance de l’entraînement clairsemé à travers plusieurs ensembles de données et architectures.
TLDR : La normalisation par lots affecte négativement l’entraînement clairsemé; Nous avons proposé une méthode d’optimisation consciente de la parcimonie pour atténuer cela et améliorer la convergence et la généralisation de l’entraînement.
Vitesse stable : une perspective de variance sur l’adaptation des flux
Donglin Yang, Yongxing Zhang, Xin Yu, Liang Hou, Xin Tao, Pengfei Wan, Xiaojuan Qi, Renjie Liao (membre du corps professoral Vector)
Résumé
Bien que l’adaptation de flux soit élégante, sa dépendance à des vitesses conditionnelles d’un seul échantillon conduit à des cibles d’entraînement à haute variance qui déstabilisent l’optimisation et ralentissent la convergence. En caractérisant explicitement cette variance, nous identifions 1) un *régime à haute variance* près du prior, où l’optimisation est difficile, et 2) un régime *à faible variance* près de la distribution des données, où les vitesses conditionnelle et marginale coïncident presque. En tirant parti de cette idée, nous proposons **Stable Velocity**, un cadre unifié qui améliore à la fois l’entraînement et l’échantillonnage. Pour l’entraînement, nous introduisons le Stable Velocity Matching (StableVM), un objectif de réduction de la variance non biaisé, ainsi que l’alignement de représentation conscient de la variance (VA-REPA), qui renforcent de manière adaptative la supervision auxiliaire dans le régime *faible variance*. Pour l’inférence, nous montrons que la dynamique dans le régime *faible variance* admet des simplifications en forme fermée, permettant l’échantillonnage stable à vitesse (StableVS), une accélération sans affinage. Des expériences approfondies sur ImageNet $256\times256$ et de grands modèles préentraînés texte-to-image et texte-vers-vidéo, incluant SD3.5, Flux, Qwen-Image et Wan2.2, démontrent des améliorations constantes en efficacité d’entraînement et un échantillonnage plus rapide de plus de $2 fois plus rapide dans le régime *faible variance* sans dégrader la qualité de l’échantillon. Notre code est disponible sur https://github.com/linYDTHU/StableVelocity.
Résumé
Les modèles génératifs modernes peuvent créer des images et des vidéos de haute qualité, mais leur entraînement efficace demeure un défi. Une des raisons est que les signaux d’apprentissage sur lesquels ils comptent peuvent être très bruyants, surtout aux premiers stades de la génération, ce qui rend l’entraînement instable et lent.
Dans ce travail, nous analysons d’où provient ce bruit et montrons qu’il est beaucoup plus élevé lorsque le modèle part d’entrées aléatoires, mais qu’il diminue beaucoup à mesure que le modèle se rapproche des données réelles. Sur la base de cette observation, nous proposons une nouvelle méthode appelée Stable Velocity qui améliore à la fois l’entraînement et la génération.
Pendant la formation, notre méthode réduit le bruit dans les signaux d’apprentissage et se concentre davantage sur les parties du processus plus faciles à apprendre. Pendant la génération, nous profitons de dynamiques plus simples dans la région à faible bruit pour accélérer l’échantillonnage sans entraînement supplémentaire.
Notre approche rend constamment la formation plus efficace et peut générer des images et des vidéos plus de deux fois plus vite, tout en maintenant la même qualité.
τ²-Bench : Évaluation des agents conversationnels dans un environnement à double contrôle
Article de mise en lumière
Victor Barres, Honghua Dong, Soham Ray, Xujie Si (affilié à la faculté Vector), Karthik Narasimhan
Résumé
Les benchmarks existants pour les agents IA conversationnelles simulent des environnements *à contrôle unique*, où seul l’agent IA peut utiliser des outils pour interagir avec le monde, tandis que l’utilisateur reste un fournisseur d’information passif. Cela diffère des scénarios réels comme le support technique, où les utilisateurs doivent participer activement à la modification de l’état du monde (partagé). Pour combler cette lacune, nous introduisons
τ²-bench, avec quatre contributions clés :
- Un nouveau **domaine à double contrôle des télécommunications** modélisé comme un Dec-POMDP, où l’agent et l’utilisateur utilisent des outils pour agir dans un environnement partagé et dynamique qui teste à la fois la coordination et la communication des agents,
- Un **générateur de tâches compositionnel** qui crée de façon programmatique des tâches diverses et vérifiables à partir de composants atomiques, assurant une couverture de domaine et une complexité contrôlée,
- Un **simulateur utilisateur fiable** étroitement connecté à l’environnement, dont le comportement est limité par des outils et des états observables, améliorant la fidélité de la simulation,
- **analyse fine de la performance de l’agent** à travers plusieurs ablations, incluant la séparation des erreurs liées au raisonnement et à la communication/coordination.
En particulier, nos expériences montrent des baisses significatives de performance lorsque les agents passent du contrôle sans utilisateur au contrôle double, soulignant les défis liés au guidage des utilisateurs. Dans l’ensemble,
τ²-bench fournit un banc d’essai contrôlé pour les agents qui doivent à la fois raisonner efficacement et guider les actions de l’utilisateur.
Résumé
Les tests d’aujourd’hui pour les assistants de service à la clientèle IA placent l’IA dans un monde où elle seule peut agir, tandis que l’utilisateur ne fait que parler. Mais dans le vrai support — comme en appelant au sujet d’un téléphone cassé — l’utilisateur doit aussi agir, redémarrant les appareils ou activant les paramètres, pendant que l’agent le guide. Pour combler cette lacune, nous introduisons τ²-bench, avec quatre contributions : 1) une nouvelle tâche de soutien télécom où l’IA et un utilisateur simulé peuvent agir sur un système partagé; 2) un générateur automatique de tâches qui construit des problèmes variés et résolubles à partir d’un petit ensemble de blocs de construction réutilisables; 3) un simulateur utilisateur dont les actions sont maintenues prévisibles et cohérentes avec ce qui est réellement possible en les liant à l’environnement plutôt qu’aux seules instructions; et 4) des mesures qui séparent les erreurs de raisonnement de l’IA de ses erreurs de communication. Des expériences montrent que même les meilleurs assistants actuels ne réussissent que 34 à 49% des nouvelles tâches, la performance chutant d’environ 20% lorsque l’IA doit guider un utilisateur au lieu d’agir seule. τ²-bench offre aux chercheurs un moyen de mesurer et d’améliorer cet écart avant que les assistants IA n’atteignent des rôles en contact direct avec la clientèle. Le code, les données et un classement sont en taubench.com.
En résumé : τ²-bench introduit une nouvelle façon de tester les agents d’IA en permettant à l’agent et à l’utilisateur simulé d’interagir dans un monde « télécom » partagé. Cela permet de créer des tâches diverses et vérifiables ainsi qu’une meilleure simulation utilisateur.
Parler, juger, coopérer : réciprocité indirecte guidée par les commérages chez les agents LLM intéressés par l’intérêt personnel
Shuhui Zhu, Yue Lin, Shriya Kaistha, Wenhao Li, Baoxiang Wang, Hongyuan Zha, Gillian Hadfield (membre du corps professoral Vector), Pascal Poupart (membre du corps professoral Vector)
Résumé
La réciprocité indirecte, c’est-à-dire aider ceux qui aident les autres, est difficile à maintenir chez des agents LLM décentralisés et intéressés sans systèmes de réputation fiables. Nous introduisons l’Agentic Linguistic Gossip Network (ALIGN), un cadre automatisé où les agents partagent stratégiquement des potins ouverts en utilisant des tons hiérarchiques pour évaluer la fiabilité et coordonner les normes sociales. Nous démontrons qu’ALIGN améliore constamment la réciprocité indirecte et résiste aux entrants malveillants en identifiant et en ostracisant les défecteurs sans modifier les incitatifs intrinsèques. Notamment, nous constatons que des capacités de raisonnement plus fortes dans les LLM mènent à une coopération plus axée sur les incitatifs, tandis que les modèles de clavardage coopèrent souvent trop même lorsqu’ils sont stratégiquement sous-optimaux. Ces résultats suggèrent que tirer parti du raisonnement des LLM à travers des commérages décentralisés est une voie prometteuse pour maintenir le bien-être social dans les écosystèmes agents.
Résumé
À mesure que les grands agents de modèles de langage commencent à représenter différents utilisateurs, entreprises ou institutions, leurs intérêts ne sont pas toujours alignés. Dans des scénarios partiellement conflictuels, les agents peuvent agir dans leur propre intérêt, ce qui peut rendre la coopération difficile : un agent peut bénéficier de l’aide sans aider les autres en retour.
Cet article étudie si les commérages publics peuvent aider à résoudre ce problème. Nous introduisons ALIGN, un cadre où les agents peuvent diffuser des messages publics sur le comportement des autres, comme louer les comportements utiles ou critiquer les comportements égoïstes. Ces messages aident les agents à bâtir une réputation et à décider à qui faire confiance lors de futures interactions.
Dans plusieurs environnements simulés, nous constatons que les commérages publics peuvent aider les agents du modèle linguistique intéressés à mieux coopérer et à obtenir de meilleurs résultats, sans changer directement leurs récompenses ni les forcer à être altruistes. Le système peut aussi réduire les dommages causés par des agents égoïstes ou malveillants en diffusant des rapports négatifs sur des comportements récurrents. Nos résultats suggèrent que le langage ouvert peut servir de mécanisme adaptatif de réputation pour les futurs systèmes d’IA multi-agents, tout en soulignant la nécessité de protections contre les faux commérages, les exclusions injustes et les abus des systèmes de réputation.
TLDR : ALIGN permet aux agents LLM intéressés de maintenir une réciprocité indirecte grâce à des commérages publics ouverts qui transmettent des signaux de réputation.
Redressement temporel pour la planification latente
Ying Wang, Oumayma Bounou, Gaoyue Zhou, Randall Balestriero, Tim G. J. Rudner (entrant membre du corps professoral de Vector), Yann LeCun, Mengye Ren
Résumé
Apprendre de bonnes représentations est essentiel pour la planification latente avec des modèles du monde. Bien que les encodeurs visuels pré-entraînés produisent de fortes caractéristiques sémantiques, ils ne sont pas conçus pour la planification et contiennent des informations sans rapport — voire nuisibles — à la planification. Inspirés par l’hypothèse du redressement perceptuel dans le traitement visuel humain, nous introduisons le redressement temporel pour améliorer l’apprentissage de la représentation en vue de la planification latente. En utilisant un régulariseur de courbure qui encourage des trajectoires latentes localement redressées, nous apprenons ensemble un encodeur et un prédicteur d’un modèle mondial Joint-Embedding Predictive Architecture (JEPA). Nous montrons que réduire la courbure de cette façon fait de la distance euclidienne dans l’espace latent un meilleur proxy de la distance géodésique et améliore le conditionnement de l’objectif de planification. Nous démontrons empiriquement que le redressement temporel rend la planification basée sur le gradient plus stable et donne des taux de réussite significativement plus élevés dans une série de tâches d’atteinte d’objectifs. Notre code est en https://agenticlearning.ai/temporal-straightening.
Résumé
Un modèle mondial apprend à prédire comment le monde va évoluer selon l’état et l’action actuels, puis utilise ces prédictions pour la planification. Cependant, dans de nombreux modèles de mondes latents, la représentation apprise n’est pas naturellement organisée pour la planification et le contrôle : les trajectoires réalisables dans l’environnement réel peuvent devenir très courbes dans l’espace latent, rendant la prédiction et la planification difficiles.
TLDR : Nous introduisons le redressement temporel pour améliorer l’apprentissage de la représentation pour la modélisation du monde et la planification latente.
Recherche de graphes au moment du test pour l’apprentissage par renforcement conditionné par un objectif
Evgenii Opryshko, Junwei Quan, Claas Voelcker, Yilun Du, Igor Gilitschenski (membre du corps professoral de Vector)
Résumé
L’apprentissage par renforcement conditionné par objectifs hors ligne (GCRL) rencontre souvent des difficultés avec les tâches à long horizon, où des erreurs dans l’estimation de la valeur s’accumulent et produisent des politiques peu fiables. On suppose généralement qu’une planification efficace à long terme est irréalisable sans formation spécialisée. En revanche, notre travail démontre que les politiques GCRL existantes peuvent accomplir des tâches à long terme lorsqu’elles sont combinées à une enveloppe de planification légère et sans entraînement. Nous constatons que les fonctions de valeur conditionnées par un but standard encodent une structure géométrique localement cohérente, suffisante pour la planification. Notre approche, la recherche de graphes en temps de test (TTGS), construit un graphique sur le jeu de données hors ligne et utilise une stratégie adaptative de sélection de sous-objectifs. Pour corriger les estimations de valeur peu fiables lors de la recherche sur le chemin le plus court, nous proposons un mécanisme novateur qui pénalise doucement les transitions longue distance. Notre méthode engendre une surcharge computationnelle négligeable et ne nécessite aucune supervision supplémentaire ni mise à jour des paramètres. Sur le benchmark OGBench, TTGS augmente considérablement les taux de réussite auprès de plusieurs apprenants et tâches de base, avec des gains principaux sur les tâches complexes de locomotion à long horizon où certains taux de réussite passent de près de zéro à plus de 90%, souvent en égalant ou surpassant les méthodes nécessitant une formation auxiliaire complexe. Le code et les vidéos sont disponibles sur https://ktolnos.github.io/ttgs.
Résumé
Apprendre à un agent IA à effectuer une longue séquence d’actions est beaucoup plus difficile que de lui enseigner des actions courtes : de petites erreurs s’accumulent, et l’agent se perd. Les correctifs existants ajoutent des planificateurs génératifs ou des réseaux neuronaux supplémentaires, mais ils sont lourds et nécessitent de refaire la chaîne de formation. Nous avons demandé si un agent qui fait déjà des pas courts et fiables pouvait gérer de longs trajets sans aucune requalification.
Nous avons développé Test-Time Graph Search (TTGS), un outil léger qui enveloppe un agent déjà entraîné. Il traite les observations des données d’entraînement comme des points de passage sur une carte et les relie en utilisant la perception propre de l’agent sur la proximité de deux situations. Une recherche du chemin le plus court choisit une chaîne de points de passage proches qui guide l’agent étape par étape. Parce que le sens de la distance de l’agent est fiable pour les endroits voisins mais bruyant pour les plus éloignés, nous privilégions la recherche vers de nombreux petits sauts plutôt que quelques longs et incertains.
Sur un benchmark standard, TTGS a fait passer les taux de réussite des tâches de navigation les plus difficiles de près de zéro à plus de 90%, tout en ajoutant moins d’une seconde de calcul. Cela permet aux praticiens de débloquer la performance à long terme auprès d’agents déjà formés, sans données ou formation supplémentaires.
TLDR : La recherche de graphes au moment du test (TTGS) démontre que les distances dérivées par valeur provenant des agents GCRL standard préentraînés peuvent guider la planification des sous-objectifs à travers les états des ensembles de données, améliorant la performance sans formation supplémentaire.
TextResNet : Découplage et Optimisation des signaux dans les systèmes d’IA composés via un réglage résiduel profond
Suizhi Huang, Mei Li, Han Yu, Xiaoxiao Li (membre du corps professoral de Vector)
Résumé
Les optimiseurs de type gradient textuel (TextGrad) permettent une propagation par rétroaction de type gradient à travers des systèmes d’IA composés. Cependant, elles ne fonctionnent pas bien pour les chaînes profondes. La cause profonde de cette limitation provient du problème de *Entanglement sémantique* dans ces flux de travail étendus. Dans la rétropropagation textuelle standard, les signaux de rétroaction mélangent des critiques locales avec des contextes en amont, menant à une *ambiguïté d’attribution*. Pour relever ce défi, nous proposons TextResNet, un cadre qui reformule le processus d’optimisation afin d’obtenir un routage précis des signaux grâce à quatre innovations clés. Premièrement, dans le passage avant, il impose des Deltas sémantiques additifs pour préserver une autoroute d’identité pour l’écoulement en pente. Deuxièmement, dans le passage en arrière, elle introduit la décomposition par gradient sémantique via un projecteur sémantique pour démêler la rétroaction dans des sous-espaces causalement indépendants. Troisièmement, il met en œuvre le routage causal, qui aroute les signaux projetés vers leurs composants spécifiques. Enfin, il effectue une planification par optimisation consciente de la densité pour exploiter les signaux détriqués afin d’allouer dynamiquement les ressources aux goulots d’étranglement clés du système. Nos résultats montrent que TextResNet obtient non seulement des performances supérieures à TextGrad, mais démontre aussi une stabilité remarquable pour les tâches agents dans les systèmes d’IA composés où les bases de base s’effondrent. Le code est disponible sur https://github.com/JeanDiable/TextResNet.
Résumé
Les systèmes d’intelligence artificielle (IA) modernes sont de plus en plus construits à partir de plusieurs agents spécialisés travaillant ensemble dans une chaîne — par exemple, un agent recherche sur le web, un autre résume le texte, et un troisième écrit la réponse finale. Cependant, l’amélioration automatique de ces systèmes multi-agents est très difficile. Lorsque la réponse finale est incorrecte, les outils existants ont du mal à identifier quel agent a commis l’erreur, ce qui entraîne des rétroactions génériques qui poussent les mauvais agents à tenter des corrections inutiles.
Pour y remédier, nous avons développé TextResNet. Inspiré par la façon dont les réseaux informatiques gèrent le trafic, TextResNet préserve les informations originales de chaque étape et utilise une IA auxiliaire pour diviser les rétroactions d’erreur en catégories propres et distinctes : les erreurs causées localement versus celles transmises lors des étapes précédentes. Il envoie ensuite la rétroaction ciblée uniquement à l’agent responsable de l’erreur, tandis qu’un système de planification intelligente concentre les efforts d’optimisation sur les plus grands goulots d’étranglement du système.
Notre méthode rend les systèmes d’IA coopératifs beaucoup plus stables et précis. Elle consomme aussi trois fois moins de ressources informatiques, ouvrant la voie à des applications d’IA multi-agents plus fiables, économiques et faciles à déboguer.
TLDR : TextResNet corrige l’intrication sémantique via une autoroute d’identité et un projecteur sémantique. Il assure un routage de rétroaction stable et surpasse les références dans l’optimisation profonde des systèmes d’IA.
ToaSt : sélection de canaux de jetons et élagage structuré pour une ViT efficace
Hyunchan Moon, Cheonjun Park, Steven Waslander (affilié du corps professoral Vector)
Résumé
Les Transformateurs de Vision (ViTs) ont connu un succès remarquable dans diverses tâches de vision, mais leur déploiement est souvent entravé par des coûts computationnels prohibitifs. Bien que l’élagage structuré des poids et la compression des jetons se soient révélés des solutions prometteuses, elles souffrent respectivement d’un réentraînement prolongé et de dépendances inter-couches qui compliquent l’optimisation. Nous proposons ToaSt, un cadre découplé appliquant des stratégies spécialisées à des composants ViT distincts. Nous appliquons une taille structurée couplée tête à tête aux modules d’auto-attention multi-têtes, en tirant parti des caractéristiques de fonctionnement de l’attention pour améliorer la robustesse. Pour les réseaux Feed-Forward (plus de 60% des FLOP), nous introduisons la sélection de canal de jetons (TCS), une méthode sans entraînement qui filtre les canaux de bruit redondants au moment de l’inférence. Des évaluations approfondies dans neuf modèles différents, dont DeiT, ViT-MAE et Swin Transformer, démontrent que ToaSt réalise de meilleurs compromis entre précision et efficacité, surpassant constamment les références existantes. Sur ViT-MAE-Huge, ToaSt atteint une précision de 88,52% (+1,64% de p) avec une réduction de 39,4% des FLOPs. ToaSt se transmet également efficacement à diverses tâches en aval (détection COCO, segmentation ADE20K, classification CIFAR-100), atteignant 52,2 contre 51,9 mAP sur COCO. Code : https://github.com/SHANNonLab-HUFS/ToaSt
Résumé
Les systèmes d’IA modernes qui comprennent les images — des scans médicaux aux voitures autonomes en passant par la recherche de photos — sont devenus remarquablement puissants, mais aussi remarquablement coûteux à exploiter. Elles exigent un calcul massif, ce qui les rend lentes et coûteuses à déployer sur des appareils quotidiens comme les téléphones, les drones et les caméras.
Nous avons développé ToaSt, une méthode qui rend ces modèles d’IA plus petits et plus rapides tout en conservant leur précision. Comme en taillant un arbre en enlevant des branches mortes, ToaSt identifie les parties du modèle qui contribuent peu à ses décisions et les enlève. Contrairement à la plupart des techniques existantes, ToaSt ne nécessite pas d’entraînement supplémentaire, il peut donc être appliqué instantanément à n’importe quel modèle préentraîné.
Testé sur neuf modèles de reconnaissance d’image différents, ToaSt a réduit le calcul jusqu’à 40% sans perdre de précision — et dans plusieurs cas, les modèles plus minces sont devenus légèrement plus précis, car retirer les composants bruyants aidait le modèle à se concentrer sur ce qui compte. La méthode s’est également transférée en douceur à d’autres tâches, notamment la détection d’objets et la segmentation de scènes.
En réduisant le coût d’exploitation des systèmes de vision IA, notre travail contribue à porter ces technologies à plus d’appareils et d’utilisateurs, tout en réduisant l’empreinte énergétique des modèles d’IA de plus en plus volumineux.
TLDR : Pondération structurée et élagage des canaux de jetons
TokSuite : Mesurer l’impact du choix du tokeniseur sur le comportement des modèles de langage
Article de mise en lumière
Gül Sena Altıntaş, Malikeh Ehghaghi, Brian Lester, Fengyuan Liu, Wanru Zhao, Marco Ciccone (boursier postdoctoral distingué Vector), Colin Raffel (membre du corps professoral Vector)
Résumé
Les tokeniseurs fournissent la base fondamentale à travers laquelle le texte est représenté et traité par les modèles de langage (LM). Malgré l’importance de la tokenisation, son rôle dans la performance et le comportement de LM est mal compris en raison du défi de mesurer l’impact de la tokenisation isolément. Pour répondre à ce besoin, nous présentons TokSuite, une collection de modèles et un benchmark qui soutient la recherche sur l’influence de la tokenisation sur les LM. Plus précisément, nous publions quatorze modèles pré-entraînés qui utilisent différents tokenizeurs prêts à l’emploi mais sont par ailleurs identiques, utilisant la même architecture, le même ensemble de données, le même budget d’entraînement et l’initialisation. Nous publions également un benchmark de robustesse multilingue qui mesure la performance du modèle sous des perturbations réelles en anglais, chinois, farsi, italien et turc, sélectionné par des annotateurs natifs. Ensemble, TokSuite permet un découplage robuste de l’influence du tokenizer d’un modèle, soutenant une série de découvertes novatrices qui éclairent les avantages et les lacunes respectifs d’un large éventail de tokenizeurs populaires.
Résumé
Avant qu’un modèle de langage ne lise un texte, il le divise d’abord en petits morceaux appelés « jetons » à partir d’un vocabulaire fixe et limité. Contrairement aux humains, qui peuvent rencontrer un nouveau mot et l’apprendre comme le sien, les modèles de langage ne peuvent fonctionner qu’avec des unités qu’ils connaissent déjà. Par exemple, le mot « docteur » pourrait être divisé en « doc » et « tor ». Ce processus, appelé tokenisation, est l’une des premières décisions prises lors de la création d’un modèle de langage, mais il est souvent considéré comme une pensée secondaire, de nombreux modèles empruntant simplement le tokeniseur utilisé par un modèle précédent. Nous étudions à quel point ce choix compte réellement.
Le défi, c’est que les modèles existants diffèrent de trop de façons (leur taille, leurs données d’entraînement, leur architecture), ce qui rend difficile d’attribuer les différences de performance uniquement au tokeniseur. Nous avons donc entraîné 14 modèles identiques en tous points sauf leur tokenizador, et les avons jumelés à un nouveau benchmark d’environ 5 000 cas de test couvrant des variations linguistiques réelles sur cinq langues, ainsi que la notation mathématique et le contenu scientifique, tous sélectionnés par des locuteurs natifs.
Nous avons constaté que la conception par tokeniseur influence constamment la robustesse d’un modèle face aux imperfections quotidiennes comme les fautes de frappe, les scripts étrangers ou les équations formatées, plus que la taille du modèle ou la durée d’entraînement. Même une toute petite différence d’espace blanc à l’intérieur d’une formule mathématique pourrait faire échouer complètement un modèle. Nous espérons que TokSuite aidera la communauté à faire des choix de tokenizateurs plus éclairés à l’avenir.
TLDR : Nous entraînons quatorze modèles identiques sauf pour la tokenisation et évaluons les effets de tokenisation sur un benchmark multilingue personnalisé conçu spécifiquement pour la tokenisation.
Unifier la robustesse et l’entraînement adversarial à travers les modèles de notation de texte
Manveer Tamber, Hosna Oyarhoseini, Jimmy Lin (affilié du corps professoral Vector)
Résumé
La recherche sur la robustesse adversaire dans les modèles de langage est actuellement fragmentée entre applications et attaques, masquant les vulnérabilités partagées. Dans ce travail, nous proposons d’unifier l’étude de la robustesse adversaire dans les modèles de notation de texte couvrant les retrievers denses, les reclasseurs et les modèles de récompense. Cela incite à adapter à la fois les attaques et les méthodes d’entraînement adversaire selon les rôles modèles. Contrairement à la génération ouverte, les échecs de notation de texte sont directement vérifiables : une attaque réussit lorsqu’un texte non pertinent ou rejeté dépasse un texte pertinent ou choisi. En utilisant cette perspective de principe de la notation de texte, nous démontrons que les formulations actuelles d’entraînement adversarial pour les modèles de langage sont souvent à courte vue, ne généralisant pas efficacement entre les attaques. Pour y remédier, nous introduisons plusieurs méthodes d’entraînement adversaire pour les modèles de notation de texte et montrons que la combinaison de méthodes d’entraînement complémentaires peut offrir une solide robustesse tout en améliorant l’efficacité des tâches. Nous soulignons également la valeur pratique de notre approche pour RLHF, montrant que nos modèles de récompense entraînés à l’adversaire atténuent le piratage de récompense et soutiennent la formation de LLM mieux alignés. Nous fournissons notre code et nos modèles pour une étude ultérieure.
Résumé
Les modèles de langage peuvent être trompés par de petits changements dans leurs entrées, mais la recherche sur ce problème est généralement répartie entre différentes applications et types d’attaques, ce qui masque des faiblesses courantes. Nous regroupons ces éléments en nous concentrant sur des modèles qui attribuent des scores au texte, y compris les modèles de recherche qui classent les résultats et les modèles de récompense qui jugent les réponses des LLM. Dans ce contexte, une attaque est simple à définir : un texte non pertinent ou mauvais ne devrait pas obtenir un score supérieur au texte pertinent ou bon. Nous constatons que les défenses courantes pour entraîner des modèles plus robustes ne se transmettent souvent pas d’une attaque à l’autre, tandis que la combinaison de différentes méthodes d’entraînement défensive offre une protection beaucoup plus large sans nuire à la précision des tâches en aval, et parfois même à l’améliorer. Lorsqu’ils sont utilisés pour entraîner des LLM à l’apprentissage par renforcement, nos modèles de récompense plus robustes sont aussi plus difficiles à manipuler et mènent à des LLM mieux alignés.
Cartes d’écoulement variationnelles : Faites du bruit pour une génération conditionnelle en une étape
Abbas Mammadov, So Takao, Bohan Chen, Ricardo Baptista (affilié de la faculté Vector), Morteza Mardani, Yee-Whye Teh, Julius Berner
Résumé
Les cartes de flux permettent une génération d’images de haute qualité en un seul passage avant. Cependant, contrairement aux modèles de diffusion itératif, l’absence d’une trajectoire d’échantillonnage explicite empêche l’intégration de contraintes externes pour la génération conditionnelle et la résolution de problèmes inverses. Nous proposons _Variational Flow Maps_, un cadre d’échantillonnage conditionnel qui fait passer la perspective du conditionnement de « guider un chemin d’échantillonnage » à « apprendre le bruit initial approprié ». Plus précisément, à partir d’une observation, nous cherchons à apprendre un _noise adaptateur model_ qui produit une distribution de bruit, de sorte qu’après avoir cartographié à l’espace de données via la carte de flux, les échantillons respectent l’observation et les données antérieures. À cette fin, nous développons un objectif variationnel de principe qui entraîne conjointement l’adaptateur de bruit et la carte d’écoulement, améliorant l’alignement bruit-données, de sorte que l’échantillonnage à partir de données complexes postérieures soit réalisé avec un simple adaptateur. Des expériences sur divers problèmes inverses montrent que les VFM produisent des échantillons conditionnels bien calibrés en une seule (ou quelques étapes). Pour ImageNet, le VFM atteint une fidélité compétitive tout en accélérant l’échantillonnage d’ordres de grandeur comparativement aux modèles alternatifs de diffusion/flux itératif.
Résumé
Contrairement aux modèles de diffusion itératif, les modèles génératifs à une ou quelques étapes comme les cartes de flux ne peuvent pas résoudre naturellement un problème inverse (par exemple, défloutage d’image, inpainting, etc.) en raison de l’absence de trajectoire d’échantillonnage, que l’on peut utiliser pour orienter vers des régions à forte probabilité. Pour résoudre ce problème, nous avons déplacé la perspective du conditionnement de « guider un chemin d’échantillonnage » à « trouver le bruit initial » qui mène à des échantillons à forte probabilité. Cela aide à résoudre une grande variété de problèmes inverses, ainsi que des problèmes plus généraux d’alignement des récompenses, tout en conservant la vitesse d’inférence fulgurante des cartes de flux en un ou quelques pas.
TLDR : Nous proposons une méthode de génération conditionnelle en une étape en inclinant l’espace bruyant.
Une très grande suite de raisonnement vidéo
Maijunxian Wang, Ruisi Wang, Juyi Lin, Ran Ji, Thaddäus Wiedemer, Qingying Gao, Dezhi Luo, Yaoyao Qian, Lianyu Huang, Zelong Hong, Jiahui Ge, Qianli Ma, Hang He, Yifan Zhou, Lingzi Guo, Lantao Mei, Jiachen Li, Hanwen Xing, Tianqi Zhao, Fengyuan Yu, Weihang Xiao, Yizheng Jiao, Jianheng Hou, Danyang Zhang, Pengcheng Xu, Boyang Zhong, Zehong Zhao, Gaoyun Fang, John Kitaoka, Xu Yile, Hua Xu, Kenton Blacutt, Tin Nguyen, Siyuan Song, Haoran Sun, Shaoyue Wen, Linyang He, Runming Wang, Yanzhi Wang, Mengyue Yang, Ziqiao Ma, Raphaël Millière, Freda Shi (membre du corps professoral Vector), Nuno Vasconcelos, Daniel Khashabi, Alan Yuille, Yilun Du, Ziming Liu, Dahua Lin, Ziwei Liu, Vikash Kumar, Yijiang Li, Lei Yang, Zhongang Cai, Hokin Deng
Résumé
Les progrès rapides des modèles vidéo se sont largement concentrés sur la qualité visuelle, laissant leurs capacités de raisonnement sous-explorées. Le raisonnement vidéo ancre l’intelligence dans des environnements visuels spatiotemporellement cohérents qui vont au-delà de ce que le texte peut naturellement capturer, permettant un raisonnement intuitif sur la structure spatio-temporelle, telle que la continuité, l’interaction et la causalité. Cependant, l’étude systématique du raisonnement vidéo et de son comportement de mise à l’échelle est freinée par l’absence de données d’entraînement au raisonnement vidéo à grande échelle. Pour combler cette lacune, nous introduisons le **Very Big Video Reasoning (VBVR) Dataset**, une ressource à une échelle sans précédent couvrant *200* tâches de raisonnement sélectionnées selon une taxonomie de principe, et plus d'*un million* de clips vidéo, ce qui le rend environ *trois ordres de grandeur* plus grand que les ensembles de données existants. Nous présentons en outre **VBVR-Bench**, un cadre d’évaluation vérifiable qui va au-delà du jugement basé sur des modèles en incorporant des notateurs alignés sur des règles et des humains, permettant un diagnostic reproductible et interprétable des capacités de raisonnement vidéo. En tirant parti de la suite VBVR, nous menons l’une des premières études de raisonnement vidéo **à l’échelle** et observons les premiers signes d’une généralisation émergente vers des tâches de raisonnement invisibles. Ensemble, le VBVR pose les bases de la prochaine étape de la recherche en raisonnement vidéo généralisable. Les données, la boîte à outils de benchmark et les modèles sont publiés publiquement à **video-reason.com**.
Résumé
L’IA d’aujourd’hui peut générer des vidéos étonnamment réalistes. Mais peut-il générer une vidéo qui *résout* réellement un problème? Produire des pixels qui paraissent réels et produire des pixels qui respectent les lois de la physique, de la géométrie et de la logique sont des capacités très différentes, et l’IA a en grande partie maîtrisé la première tout en luttant encore avec la seconde.
Nous étudions ce que nous appelons le **raisonnement vidéo** : utiliser la vidéo elle-même comme moyen de pensée. Tout comme un mathématicien esquisse un diagramme pour résoudre un problème, une IA vidéo devrait être capable de *générer* une vidéo démontrant une solution : l’agent naviguant avec succès dans le labyrinthe, les objets correctement triés, la balle obéissant aux lois de la physique. Les progrès ont été lents parce que les chercheurs manquent d’un vaste ensemble organisé de tâches dont l’ordinateur peut vérifier objectivement les réponses.
Nous avons construit **VBVR (Very Big Video Reasoning)** : environ un million de courtes vidéos couvrant 200 tâches de raisonnement telles que naviguer dans des labyrinthes, trier des formes, suivre des objets à travers l’occlusion, prédire les rebonds et les flux de fluides. Chaque tâche a un résultat correct mathématiquement vérifiable, ce qui nous permet d’évaluer automatiquement la vidéo générée par un modèle, sans dépendre de jugements humains ou d’IA subjectifs.
En utilisant cet ensemble de données, nous avons entraîné l’un des modèles de raisonnement vidéo les plus solides construits à ce jour. À mesure que nous augmentions l’échelle des données d’entraînement, le modèle a commencé à gérer correctement des tâches de raisonnement qu’il n’avait jamais observées pendant l’entraînement. C’est une preuve précoce que, à mesure que l’échelle des données augmente, l’IA vidéo pourrait progressivement réduire l’écart avec le bon sens visuel que les humains tiennent pour acquis. Nous rendons publics les ensembles de données, les outils d’évaluation et les modèles entraînés.
TLDR : Nous introduisons VBVR, une suite avec le plus grand jeu de données de raisonnement vidéo jamais réalisé et un benchmark reproductible basé sur des règles. Les expériences de mise à l’échelle révèlent des signes précoces de généralisation émergente.
Quand le RAG fait mal : Diagnostiquer et atténuer la distraction de l’attention chez les LVLM augmentés par la récupération
Beidi Zhao, Wenlong Deng, Xinting Liao (boursier postdoctoral distingué Vector), Yushu Li, Nazim Shaikh, Yao Nie, Xiaoxiao Li (membre du corps professoral Vector)
Résumé
Bien que la génération augmentée par récupération (RAG) soit l’un des paradigmes dominants pour améliorer les grands modèles de vision et de langage (LVLM) sur les tâches VQA basées sur la connaissance, des travaux récents attribuent les échecs du RAG à une attention insuffisante portée au contexte récupéré, proposant de réduire l’attention accordée aux jetons images. Dans ce travail, nous identifions un mode d’échec distinct que l’étude précédente avait négligé : la distraction de l’attention (MA). Lorsque le contexte récupéré est suffisant (très pertinent ou incluant la bonne réponse), le texte récupéré supprime l’attention visuelle globalement, et l’attention portée aux jetons d’image s’éloigne des régions pertinentes à la question. Cela conduit à des échecs sur les questions auxquelles le modèle pouvait initialement répondre correctement sans le texte récupéré. Pour atténuer ce problème, nous proposons MAD-RAG, une intervention sans entraînement qui découple l’ancrage visuel de l’intégration du contexte grâce à une formulation à double question, combinée à un mélange d’attention pour préserver les preuves conditionnées par l’image. Des expériences approfondies sur OK-VQA, E-VQA et InfoSeek démontrent que MAD-RAG surpasse systématiquement les références existantes dans différentes familles de modèles, produisant des gains absolus allant jusqu’à 4,76%, 9,20% et 6,18% par rapport à la référence RAG classique. Notamment, MAD-RAG corrige jusqu’à 74,68% des cas de défaillance avec une surcharge computationnelle négligeable.
Résumé
Les modèles de grande vision et langage augmentés par la récupération (LVLM) améliorent la réponse visuelle aux questions en utilisant des connaissances externes. Cependant, même lorsque le modèle peut répondre correctement à une question grâce à sa connaissance paramétrique, ajouter un contexte récupéré par oracle de haute qualité peut le faire échouer.
Nous identifions un mode de défaillance appelé distraction de l’attention (DA), incluant (1) AD intermodal : le contexte récupéré supprime l’attention allouée aux jetons d’image, et (2) AD intra-image : l’attention visuelle s’éloigne des régions visuelles pertinentes à la question vers des régions irréelles. Pour y remédier, nous proposons MAD-RAG, une méthode sans entraînement qui sépare l’ancrage visuel de l’intégration des connaissances et récupère la capacité d’ancrage visuel des LVLM augmentés par la récupération.
La découverte d’AD et de MAD-RAG mène à des réponses plus précises et fiables sur les benchmarks VQA basés sur les connaissances, avec un coût computationnel minimal, ce qui le rend pratique pour les systèmes multimodaux réels.
TLDR : Nous avons proposé une méthode MAD-RAG pour réduire la distraction de l’attention dans les LVLMS augmentés par récupération
Qui est en charge? Schémas de dépouillement dans l’utilisation réelle des LLM
Mrinank Sharma, Miles McCain, Raymond Douglas, David Duvenaud (membre du corps professoral de Vector)
Résumé
Nous présentons la première analyse empirique à grande échelle des schémas de dépouillement dans les interactions réelles avec les assistants IA, en analysant 1,5 million de conversations Claude.ai consommateurs en utilisant une approche préservant la vie privée. Nous nous concentrons sur le potentiel de désautonomisation situationnelle, qui survient lorsque les interactions avec des assistants IA risquent d’amener les utilisateurs à former des perceptions déformées de la réalité, à porter des jugements de valeur inauthentiques ou à agir de manière déplacée par leurs valeurs. Quantitativement, nous constatons que des formes sévères de potentiel de perte de pouvoir surviennent dans moins d’une conversation sur mille, bien que les taux soient nettement plus élevés dans des domaines personnels comme les relations et le mode de vie. Qualitativement, nous découvrons plusieurs schémas préoccupants, tels que la validation des récits de persécution et des identités grandioses avec un langage flagornant emphatique, des jugements moraux définitifs sur des tiers, et un script complet de communications personnelles chargées de valeurs que les utilisateurs semblent appliquer mot pour mot. L’analyse des tendances historiques révèle une augmentation de la prévalence du potentiel de perte de pouvoir au fil du temps. Nous constatons aussi que les interactions avec un plus grand potentiel de perte de pouvoir reçoivent des cotes d’approbation plus élevées des utilisateurs, ce qui pourrait suggérer une tension entre les préférences à court terme et l’autonomisation humaine à long terme.
Résumé
Nous présentons la première enquête empirique à grande échelle sur la façon dont les assistants IA affectent l’autonomie des utilisateurs, en examinant 1,5 million de conversations Claude.ai à l’aide de méthodes de protection de la vie privée. Nous constatons que, bien que des risques sévères de perte de pouvoir apparaissent dans moins de 0,1% des conversations globales, les taux augmentent considérablement dans les domaines personnels tels que les relations et les choix de mode de vie. Des tendances préoccupantes incluent des systèmes d’IA qui renforcent les théories du complot, la délivrance de déclarations morales absolues et la rédaction de messages relationnels que les utilisateurs envoient mot pour mot. Nous constatons également que le potentiel de dépouillement a augmenté au fil du temps, et que les conversations présentant un plus grand potentiel de dépouillement ont reçu des cotes de satisfaction des utilisateurs plus élevées, révélant une tension importante entre les préférences des utilisateurs et l’épanouissement humain à long terme.
TLDR : Nous avons examiné l’utilisation anonymisée des LLM pour caractériser quand les gens abandonnent leur autonomie sans le vouloir.
Qui interroger pour quoi : Élicitation adaptative de groupe via des interactions LLM à plusieurs tours
Ruomeng Ding, Tianwei Gao, Tom Zollo, Eitan Bachmat, Richard Zemel (membre du corps professoral de Vector), Xinyu Yang
Résumé
Obtenir de l’information pour réduire l’incertitude concernant les propriétés latentes au niveau du groupe est un problème central dans l’évaluation collective, la modélisation des préférences et l’agrégation d’opinions, et est particulièrement important dans les études basées sur des enquêtes. Bien que les interactions en langage naturel offrent une interface flexible, les méthodes existantes reposent généralement sur des questionnaires fixes et des groupes de répondants statiques, et ne s’adaptent pas aux réponses partielles ou manquantes entre les rondes. Pour combler cet écart, nous étudions l’élicitation d’information adaptative par des interactions à plusieurs tours entre un grand modèle de langage et un groupe d’individus, où les requêtes et les répondants sont sélectionnés de manière adaptative pour déduire les propriétés latentes du groupe. Nous proposons un cadre théoriquement fondé qui, à chaque tour, sélectionne conjointement une requête et un sous-ensemble de répondants en fonction des réponses observées précédemment afin de réduire efficacement l’incertitude concernant une quantité latente cible (par exemple, l’inclination politique au niveau du groupe). Motivée par des contraintes pratiques d’enquête, telles que le nombre limité de questions et la participation coûteuse, notre stratégie maximise le gain d’information avec un budget fixe. Pour traiter les réponses manquantes ou incomplètes, nous combinons des réseaux de neurones graphiques pour agréger ou imputer l’information partielle des groupes avec un critère de théorie de l’information qui guide la sélection par tour. À travers trois ensembles de données d’opinions du monde réel, nous obtenons des améliorations constantes dans la prévision des réponses au niveau de la population sous des budgets restreints, incluant un gain relatif de plus de 12% sur le CES avec un budget de 10% des répondants.
Résumé
Comprendre ce qu’un groupe de personnes pense de la politique, des politiques ou des enjeux sociaux signifie généralement poser à tout le monde le même ensemble de questions fixes. Mais c’est lent, coûteux, et cela ignore le fait que certaines questions et certains répondants sont beaucoup plus informatifs que d’autres. Et si nous pouvions mener des sondages plus intelligents qui apprennent au fur et à mesure, en posant les bonnes questions aux bonnes personnes à chaque étape?
Nous avons développé un cadre piloté par l’IA qui réalise des sondages comme une conversation adaptative. À chaque manche, le système sélectionne à la fois quelle question poser et à qui les personnes la poser, en fonction de ce qu’il a déjà appris, un peu comme un détective qui concentre les questions de suivi là où les réponses sont les plus révélatrices. Lorsque certaines personnes ne répondent pas, le système comble les lacunes en utilisant un modèle basé sur le réseau qui s’appuie sur les réponses d’individus similaires. Nous avons testé notre approche sur trois ensembles de données d’opinion publique du monde réel et avons constaté qu’elle surpasse systématiquement les méthodes d’enquête standard dans des budgets serrés, obtenant une précision supérieure de plus de 12% dans la prédiction des opinions des groupes tout en ne sondant que 10% des répondants.
Ce travail pourrait rendre les sondages d’opinion, les études de marché et les enquêtes politiques plus rapides, moins coûteux et plus précis, aidant les organisations à mieux comprendre les communautés qu’elles desservent avec moins de ressources.
TLDR :
Nous proposons un cadre d’élicitation adaptative consciente de la population qui sélectionne conjointement les questions et les répondants afin d’améliorer la prédiction au niveau du groupe avec des budgets d’enquête limités.
Restez connecté à Vector
Obtenez les dernières mises à jour sur la recherche révolutionnaire, les opportunités de carrière et les développements dans la communauté de l’IA au Canada.