Janssen Pharmaceuticals améliore la précision du machine learning de 21 % grâce à Amazon SageMaker
2022
Janssen Pharmaceuticals (Janssen), un groupe de sociétés pharmaceutiques qui fait partie de Johnson & Johnson depuis 1961, utilise le machine learning (ML) pour mieux comprendre l’expérience des patients qui suivent les thérapies Janssen. Pour automatiser le flux de travail de déploiement et créer une meilleure interface entre les environnements de développement et de production, les scientifiques de données de Janssen ont utilisé Amazon Web Services (AWS). Grâce aux services AWS, dont Amazon SageMaker, un service de ML qui peut servir à créer, entraîner et déployer des modèles de ML pour quasiment tous les cas d’utilisation, Janssen a mis en œuvre un processus d’opérations de ML (MLOps) automatisé qui a amélioré la précision des prédictions du modèle de 21 % et augmenté la vitesse de l’ingénierie des fonctionnalités d’environ 700 %, aidant ainsi Janssen à réduire ses coûts tout en augmentant son efficacité.
Au lieu d’organiser chaque étape du processus de manière séquentielle, nous avons pu mettre en parallèle les tâches de préparation des données et d’ingénierie des fonctionnalités, ainsi que la façon dont elles sont orchestrées, en combinant AWS Glue et AWS Step Functions. »
Jenna Eun
Principal Data Scientist, Janssen Pharmaceuticals
À la recherche d’une automatisation dans les MLOps pour accélérer la recherche
La gamme de produits Janssen couvre un large éventail de domaines thérapeutiques, notamment l’immunologie, les maladies infectieuses, les neurosciences et l’oncologie. « Il est important de prodiguer aux patients les meilleurs soins tout au long de leur parcours thérapeutique complexe. Nous utilisons donc l’intelligence artificielle et le machine learning pour comprendre comment les patients perçoivent le traitement et mieux répondre à leurs besoins tout au long de ce parcours », explique Jenna Eun, Principal Data Scientist chez Janssen.
Pour accélérer l’impact qu’ont les solutions basées sur le machine learning sur l’expérience des patients, l’équipe des sciences des données commerciales de Janssen Business Technology a décidé de se concentrer sur les MLOps, un ensemble de pratiques visant à déployer et à maintenir de manière fiable et efficace des modèles de machine learning en production, à accroître l’automatisation et à répondre aux exigences métier et technologiques. « Notre objectif pour les MLOps est de faciliter l’expérimentation et le suivi des performances des modèles au fil du temps, explique Mme Eun. La facilité d’expérimentation et l’exploration approfondie de l’espace des hyperparamètres sont importantes pour établir la confiance dans les modèles de machine learning. »
Janssen a décidé de constituer une équipe interfonctionnelle pour créer un processus MLOps automatisé en raison de l’importance d’aligner ses besoins technologiques sur les exigences en matière de sécurité interne. « Comme les processus que nous élaborons utilisent des données de santé, nous avons mis en place des mesures de sécurité et de confidentialité rigoureuses que nous devons suivre de près lors du développement et de la mise en œuvre de nos solutions technologiques », déclare Mme Eun. À partir de fin 2020, l’équipe des sciences des données commerciales de Janssen Business Technology et l’équipe Technology CloudX de Johnson & Johnson ont travaillé en collaboration avec l’équipe d’architecture de solutions Amazon SageMaker et AWS Professional Services, une équipe internationale d’experts qui peut aider les entreprises à atteindre les résultats métier souhaités sur AWS.
Augmentation de la vitesse et de la précision du machine learning sur AWS
En collaboration avec l’équipe d’architecture de solutions Amazon SageMaker et AWS Professional Services, l’équipe des sciences des données commerciales de Janssen Business Technology et l’équipe Technology CloudX de Johnson & Johnson ont automatisé la préparation des données et proposé des modules d’ingénierie des fonctionnalités en moins de trois mois. L’ingénierie des fonctionnalités est le processus qui consiste à créer des variables d’entrée à partir des données des patients pour entraîner des modèles de machine learning supervisés. En automatisant cette procédure, les équipes ont pu accélérer la vitesse de préparation des données d’environ 600 % et la vitesse d’ingénierie des fonctionnalités d’environ 700 %. Pour ce faire, Janssen a utilisé AWS Step Functions, un service de flux de travail visuel à faible code qui simplifie la séquence des étapes nécessaires à la collecte, au traitement et à la normalisation des données source. AWS Step Functions coordonne les tâches sur AWS Glue, un service d’intégration de données sans serveur, doté d’une fonctionnalité permettant de synchroniser facilement les environnements de développement et de production afin d’accélérer le déploiement de solutions de machine learning expérimentées et optimisées. « Au lieu d’organiser chaque étape du processus de manière séquentielle, nous avons pu mettre en parallèle les tâches de préparation des données et d’ingénierie des fonctionnalités, ainsi que la façon dont elles sont orchestrées, en combinant AWS Glue et AWS Step Functions, explique Mme Eun. Cela nous a permis de connecter facilement les environnements de développement et de production afin que tout ce que nous expérimentons puisse être rapidement converti en tâches AWS Glue, qui sont lancées par AWS Step Functions. »
Après avoir mis en œuvre la solution MLOps sur AWS, Janssen a amélioré la précision de sa modélisation prédictive de 21 %. « Comme le pipeline de données est davantage automatisé et prend moins de temps, nous pouvons consacrer plus de temps aux performances du modèle », déclare Mme Eun. L’optimisation des hyperparamètres fait partie intégrante de l’amélioration de la précision du modèle de ML. Une fois que l’équipe Janssen a défini les modèles et les données, elle utilise Amazon SageMaker pour régler automatiquement un modèle en ajustant des milliers de combinaisons de paramètres d’algorithme afin d’obtenir les prévisions les plus précises que le modèle est capable de produire. Cette automatisation, combinée à son algorithme d’optimisation bayésienne, réduit considérablement le temps nécessaire à la recherche d’un paramètre. « Nous sommes plus confiants quant au modèle de machine learning qui en résulte, car nous avons effectué une recherche approfondie des hyperparamètres », poursuit Mme Eun.
L’équipe Janssen et l’équipe Technology CloudX de Johnson & Johnson ont pu documenter ce projet et le partager avec d’autres équipes de Johnson & Johnson participant à des projets de ML similaires. Le partage des enseignements permet d’accélérer les projets qui doivent également être conformes aux politiques de sécurité de Johnson & Johnson et de favoriser une culture MLOps au sein de l’organisation. « En créant un modèle que les autres doivent suivre, nous avons montré comment connecter différents services AWS afin de créer un pipeline de machine learning complet au sein de l’environnement Johnson & Johnson, explique Mme Eun. La capacité à créer et à améliorer l’efficacité de certaines parties de notre précédent processus de développement et de déploiement du machine learning nous a ouvert les yeux sur la flexibilité et la capacité de mise à l’échelle dont nous pouvions bénéficier. »
Amélioration des traitements pour les patients aux quatre coins du monde
La solution MLOps de Janssen permet de fournir des solutions de science des données à grande échelle. Mme Eun déclare : « Alors que nous déployons notre solution dans le monde réel et montrons comment elle peut faire la différence, nous envisageons de l’étendre à de plus grandes régions géographiques et de l’appliquer à d’autres cas d’utilisation métier chez Johnson & Johnson. »
À propos de Janssen Pharmaceuticals
Société appartenant à Johnson & Johnson depuis 1961, Janssen Pharmaceuticals est une organisation de recherche et développement dont l’objectif est d’améliorer les résultats pour les patients atteints de maladies graves dans six domaines thérapeutiques, notamment la santé cardiovasculaire, l’immunologie, les neurosciences et l’oncologie.
Avantages d’AWS
- Accélération de la préparation des données d’environ 600 %
- Accélération de l’ingénierie des fonctionnalités d’environ 700 %
- Amélioration de la précision des modèles de machine learning de 21 %
- Mise en place d’une architecture de référence MLOps standard pour les autres équipes de Johnson & Johnson
Services AWS utilisés
Amazon SageMaker
Amazon SageMaker aide les scientifiques des données et les développeurs à préparer, créer, entraîner et déployer rapidement des modèles d'apprentissage automatique (ML) de haute qualité en rassemblant un large éventail de fonctionnalités conçues spécialement pour l'apprentissage automatique.
AWS Step Functions
AWS Step Functions est un service de flux visuels low code qui permet aux développeurs de créer des applications distribuées, d'automatiser les processus informatiques et métier et de créer des pipelines de données et de machine learning à l'aide des services AWS.
AWS Glue
AWS Glue est un service d'extraction, de transformation et de chargement (ETL) entièrement géré qui permet aux clients de préparer et de charger facilement leurs données pour l'analyse.
AWS Professional Services
L'organisation AWS Professional Services est constituée d'une équipe mondiale d'experts en mesure de vous aider à obtenir les résultats professionnels escomptés en utilisant le cloud AWS.
Démarrer
Les organisations de toutes tailles et de tous secteurs transforment leur activité et exécutent leurs missions au quotidien à l'aide d'AWS. Contactez nos experts et démarrez votre transition vers AWS dès aujourd'hui.