La genèse de l'Académie PNL de Manuvie

10 novembre 2020

10 novembre 2020
Par Jonathan Woods

Au début de l'année 2020, les scientifiques des données de Manuvie du monde entier ont participé à la première NLP Academy de l'entreprise. Cette académie - une plongée de quatre jours dans le traitement du langage naturel (NLP) - s'est concentrée sur la modélisation des sujets, une technique qui automatise la classification des documents en fonction du sujet. Pour une grande compagnie d'assurance qui dispose d'une grande quantité de textes non structurés - des transcriptions d'appels de clients aux demandes de prestations et aux propositions d'assurance - l'automatisation de la lecture, de l'analyse et du tri des documents est d'une valeur inestimable.

La NLP Academy fait partie de la fonction Advanced Analytics de Manuvie, qui a été créée en 2016 dans le cadre d'un effort stratégique de transformation de l'entreprise. Le plan de cette fonction comprenait la création d'une série d'équipes d'experts appelées Centres d'excellence (CoE), qui sont chargées de comprendre les nouvelles recherches et de diriger le développement technique au sein de l'entreprise.

Le Centre d'excellence en PNL, l'équipe qui a dirigé l'Académie du PNL, est né de l'expérience de Manuvie avec l'Institut Vecteur. En tant que commanditaire de l'Institut Vector, les scientifiques de Manuvie peuvent participer aux projets d'IA de l'industrie hébergés par l'Institut Vector et travailler avec les meilleurs chercheurs en IA sur des expériences pertinentes pour l'entreprise. L'un de ces projets était le projet Recreation of Large-Scale Pre-trained Language Models (Récréation de modèles de langage pré-entraînés à grande échelle ) de Vector, plus connu sous le nom de NLP Project (Projet NLP).

Mateusz Ujma, vice-président adjoint de la recherche et du développement en analytique et en IA de Manuvie, parle de cette expérience : "Après nous être engagés dans le projet NLP avec Vector, cela a suscité plus d'intérêt pour le NLP en tant que compétence que tous nos scientifiques de données devraient avoir, et quelques mois plus tard, nous avons fondé le NLP CoE."

Le projet NLP a réuni des scientifiques de Manuvie, des chercheurs de Vector et d'autres entreprises commanditaires pour reproduire BioBERT, un modèle de représentation du langage avancé formé pour comprendre le langage général ainsi que les termes médicaux spécifiques et leurs contextes. Le modèle a également été affiné pour effectuer des tâches liées au langage comme la résolution d'entités nommées (extraction d'entités biomédicales nommées telles que les gènes, les protéines et les maladies), l'extraction de relations (déterminer si deux mots sont liés, compte tenu du contexte du texte), les tâches de réponse aux questions (trouver des réponses à des questions spécifiques dans un corps de texte) et les résumés de texte (extraire des phrases d'un document pour créer un résumé et demander à un modèle de décrire le texte d'un document avec ses propres mots).

Travailler sur la modélisation NLP la plus avancée avec Vector a permis à l'équipe de se familiariser avec les nouveaux développements sur lesquels elle devait capitaliser, ce qu'elle a fait depuis en entraînant le modèle BERT sur des données réelles de centres de contact pour aider à identifier les points de douleur des clients.

Une partie du rôle de Vector dans le projet NLP a consisté à identifier les recherches de pointe qui auraient le plus d'impact sur les participants de l'industrie. Ujma explique : "Étant donné qu'il y a des centaines de nouveaux articles liés au NLP chaque année, il est difficile de traiter toute cette recherche de qualité, mais Vector a agi comme un filtre et n'a apporté que la recherche la plus pertinente."

Eugene Wen, vice-président de Group Advanced Analytics, explique comment le rôle de Vector en tant que filtre de publications sur l'IA à la fine pointe de la technologie appuie l'ambition plus vaste de Manuvie : "Nous voulons devenir un chef de file dans l'application de l'analytique avancée aux entreprises. La NLP Academy est une étape importante de ce parcours. La contribution de Vector se reflète très bien dans le succès de notre académie interne. "

Le parrainage de Vector - que M. Wen considère comme un "investissement stratégique" - a également porté ses fruits en termes d'acquisition de talents. Dans le cadre du projet BioBERT, Shobhit Jain, scientifique en chef des données chez Manuvie et participant au projet NLP de Vector, a travaillé avec Faiza Khattak, chercheuse de Vector, qui était alors post-doctorante à l'Université Western. Mme Khattak s'intéressait à l'industrie et, grâce à ses interactions dans le cadre du projet et lors d'un événement organisé par Vector en l'honneur de Geoffrey Hinton, lauréat du prix Turing, l'équipe de Manuvie s'est familiarisée avec elle et l'a bientôt embauchée au Centre d'expertise.

Selon M. Jain, le projet PNL est un excellent endroit pour trouver des experts de la technique : "Tous les participants étaient intéressés par la PNL et, comme j'avais travaillé avec certains d'entre eux dans le cadre de ce projet, je savais à quel point ils étaient compétents.

Pour sa part, Mme Khattak trouve attrayante l'approche de Manuvie qui consiste à conserver, à enseigner et à appliquer les nouvelles recherches à l'interne par l'entremise de la NLP Academy. "Dans bien des cas, le monde universitaire et l'industrie sont totalement opposés", dit-elle. "Ce que fait Manuvie, c'est combler le fossé tout en aidant ses employés à rester en contact avec la recherche. Leurs connaissances ne deviennent pas obsolètes ou dépassées.

Pour combler cette lacune, d'autres programmes liés à l'IA sont en cours dans le cadre de la série d'académies de Manuvie. Par exemple, la Executive AI Academy permet actuellement aux quelque 1 500 vice-présidents et vice-présidents adjoints de Manuvie dans le monde entier de se familiariser avec l'IA, ce qui leur permet de cerner les problèmes qui se prêtent à des solutions d'IA et de faire participer diverses équipes d'analyse afin d'offrir une valeur commerciale aux premières lignes.

Tous ces travaux préparent Manuvie à tirer parti de l'IA à grande échelle. Selon M. Wen, l'objectif est de tirer parti des talents de Manuvie en matière d'IA et de ses nouvelles recherches pour "intégrer l'IA et l'analyse avancée dans tous nos secteurs d'activité".

L'objectif ultime : "permettre à l'entreprise de générer une nouvelle valeur et d'offrir un meilleur service à nos clients".

En rapport :

Des protocoles normalisés sont essentiels pour un déploiement responsable des modèles linguistiques

Les inconnues connues : Geoff Pleiss, chercheur chez Vector, se penche sur l'incertitude pour rendre les modèles de ML plus précis.

Un homme regarde un tableau blanc sur lequel sont inscrites des formules en rouge.
Perspectives
Une IA digne de confiance

Comment mettre en œuvre des systèmes d'IA en toute sécurité