La genèse de l’Académie NLP de Manulife

10 novembre 2020

Blogue 2020IAgénérative Traitement du langage naturelIA fiable

Photo par Shahadat Rahman sur Unsplash

10 novembre 2020

Par Jonathan Woods

Au début de 2020, des data scientists de Manulife du monde entier ont participé à la première Académie NLP de l’entreprise. Cette Académie — une plongée approfondie de quatre jours sur le traitement du langage naturel (PNL) — s’est concentrée sur la modélisation thématique, une technique qui automatise la classification des documents selon le sujet. Pour une grande compagnie d’assurance avec une grande quantité de texte non structuré — des transcriptions d’appels clients aux soumissions de prestations et aux demandes d’assurance — automatiser la lecture, l’analyse et le tri précis des documents est extrêmement précieux.

L’Académie NLP fait partie de la fonction Advanced Analytics de Manulife, créée en 2016 comme un effort stratégique de transformation des affaires. Le plan de cette fonction comprenait la création d’une suite d’équipes d’experts appelées Centres d’Excellence (CoE), chargées de comprendre les nouvelles recherches et de diriger le développement technique au sein de l’entreprise.

Le Centre d’excellence NLP, l’équipe qui dirigeait l’Académie NLP, est né de l’expérience de Manulife avec le Vector Institute. En tant que commanditaire de Vector, les scientifiques de Manulife participent à des projets industriels d’IA hébergés par Vector, travaillant aux côtés de chercheurs d’élite en IA sur des expériences commerciales pertinentes. L’un de ces projets était Recreation of Large-Scale Pre-trained Language Models par Vector – ou, comme on l’appelle plus couramment, le projet NLP.

Mateusz Ujma, vice-président adjoint à la recherche et au développement en analytique et IA chez Manulife, déclare à propos de cette expérience : « Après avoir participé au projet NLP avec Vector, cela a suscité un intérêt accru pour le NLP comme compétence que tous nos data scientists devraient posséder, et quelques mois plus tard, nous avons fondé le COE du NLP. »

Le projet NLP a réuni des data scientists de Manulife, des chercheurs en vecteurs et d’autres entreprises sponsors pour reproduire BioBERT, un modèle avancé de représentation linguistique entraîné à comprendre le langage général ainsi que des termes médicaux spécifiques et leurs contextes. Le modèle a également été affiné pour effectuer des tâches liées au langage comme la résolution d’entités nommées (extraction d’entités biomédicales nommées telles que des gènes, des protéines et des maladies), l’extraction de relations (déterminer si deux mots sont liés, compte tenu du contexte du texte), des tâches de réponse à des questions (trouver des réponses à des questions spécifiques dans un corps de texte) et des résumés textuels (extraction de phrases d’un document pour créer un résumé et faire en sorte qu’un modèle décrise le texte d’un document avec ses propres mots).

Travailler sur la modélisation NLP la plus avancée avec Vector a familiarisé l’équipe avec les nouveaux développements qu’ils devraient exploiter, et qu’ils ont depuis réalisés en entraînant le modèle BERT sur de vraies données de centres de contact pour aider à identifier les points sensibles des clients.

Une partie du rôle de Vector dans le projet NLP consistait à identifier quelles recherches de pointe auraient le plus d’impact pour les participants de l’industrie. Ujma explique : « Étant donné qu’il y a des centaines de nouveaux articles liés au PNL chaque année, il est difficile de traiter toutes ces excellentes recherches, mais Vector a agi comme un filtre et n’a apporté que les recherches les plus pertinentes. »

Eugene Wen, vice-président du groupe Advanced Analytics, explique comment le rôle de Vector comme filtre des publications d’IA de pointe soutient l’ambition plus large de Manulife : « Nous visons à devenir une organisation de premier plan dans l’application de l’analytique avancée dans les entreprises. L’Académie NLP est une étape importante dans ce parcours. La contribution de Vector se reflète très bien dans le succès de notre académie interne. »

Le parrainage de Vector – que Wen considère comme un « investissement stratégique » – a également porté ses fruits sous forme d’acquisition de talents. Sur le projet BioBERT, Shobhit Jain, data scientist principal chez Manulife et participant au projet Vector NLP, a travaillé aux côtés de la chercheuse Vector Faiza Khattak, alors postdoctorante à l’Université Western. Khattak s’intéressait à l’industrie, et grâce à des interactions sur le projet et lors d’un événement Vector en l’honneur du lauréat du prix Turing, Geoffrey Hinton, l’équipe de Manulife s’est familiarisée avec elle et l’a rapidement embauchée au Centre d’expertise.

Jain affirme que le projet NLP est un excellent endroit pour trouver des experts dans la technique : « Tous ceux qui étaient là s’intéressaient au NLP, et comme j’avais travaillé avec certains d’entre eux sur ce projet, je savais à quel point ils sont bons. »

Khattak, pour sa part, trouve attrayante l’approche interne de Manulife, qui consiste à organiser en interne, à enseigner et à appliquer les nouvelles recherches via l’Académie NLP. « Le milieu universitaire et l’industrie sont totalement opposés dans bien des cas », dit-elle. « Ce que fait Manulife, c’est combler le fossé tout en aidant ses employés à rester connectés à la recherche. Leurs connaissances ne deviennent pas obsolètes ou dépassées. »

Pour combler davantage cet écart, davantage de programmes liés à l’IA dans la suite des académies de Manulife sont maintenant en cours. Par exemple, une Executive AI Academy met actuellement à jour les quelque 1 500 vice-présidents et AVP de Manulife à travers le monde sur l’IA, leur permettant d’identifier des problèmes adaptés aux solutions d’IA et d’engager diverses équipes analytiques pour apporter de la valeur d’affaires en première ligne.

Tout ce travail prépare Manulife à tirer de la valeur de l’IA à grande échelle. Selon Wen, le plan est de tirer parti des talents en IA de Manulife et des nouvelles recherches pour « intégrer l’IA et l’analytique avancée dans tous les domaines de notre activité ».

L’objectif ultime : « permettre à l’entreprise de générer une nouvelle valeur et un meilleur service à notre client. »

À lire aussi :

Logo vectoriel
2024
Recherche
Recherche 2024
IA fiable

Des experts de confiance et de sécurité en IA de renommée mondiale publient un article majeur sur la gestion des risques liés à l’IA dans la revue Science

Un homme tape sur un portable
2024
IA générative

Comment les entreprises peuvent équilibrer l’innovation en IA et la cybersécurité

Trois personnes fixent un portable avec le logo Vector dessus
2024
IA générative
Recherche
Recherche 2024

Benchmarking du Grok-1 de xAI