Articles
2024/02/20 MLOps : En phase de run, le toil est un ennemi à regarder dans les yeux
https://blog.octo.com/mlops–en-phase-de-run-le-toil-est-un-ennemi-a-regarder-dans-les-yeux
⚠️ Si le nombre de personnes qui opèrent vos produits ML en phase de run est proportionnel au nombre de produits ML en production ; si la vitesse de développement de nouvelles fonctionnalités s’est écroulée au moment du passage en production ; le toil vous a, vous aussi, déjà paralysé sans que vous ne vous en rendiez compte.
ℹ️ Le toil, labeur en français, décrit l’exploitation d’un service en production. Elles peuvent être répétitives, manuelles, automatisables, elles ne changent pas le service rendu par le système, elles peuvent augmenter de façon linéaire avec le nombre d’utilisateurs.
🔭 Maintenant que certaines organisations ont passé le cap de la mise en production de nombreux modèles de ML, elles se retrouvent paralysé par ce toil.
📄 Avec Aurélien Massiot, nous avons écrit un article à ce sujet sur le blog OCTO Technology. Au menu, prendre conscience de ce que c’est, de comment il vous paralyse, savoir le mesurer puis le traiter.
2023/04/12 Architecture Decision Record : on commence aujourd’hui
https://blog.octo.com/architecture-decision-record/
Écrit sur le blog d’OCTO, cet article décrit l’architecture decision record comme un puissant moyen de facilitation et d’archivage des prises de décisions. Il propose de rédiger l’ADR as-code et d’intégrer des diagrammes as-code.
2023/04/04 Compte rendu du talk de Benjamin Bayart – « Sous le capot du cloud souverain »
Compte rendu du talk de Benjamin Bayart à la Duck Conf 2023. Benjamin Bayart propose de parler de cloud sous contraintes plutôt que souverain. Il cite les contraintes (réglementaires, techniques, etc.), liste les solutions existantes et nous incite à sortir de notre syndrome de l’imposteur.
2022/12/06 [MLOps] Monitoring & proactive notification d’une application de ML
https://blog.octo.com/mlops-monitoring-et-proactive-notification/
Écrit sur le blog d’OCTO, cet article détail les origines des erreurs d’une application de ML en production, propose une démarche pour créer des sondes de monitoring et d_‘alerting_.
2022/09/20 Intégrer au plus tôt la sécurité dans les delivery de Machine Learning
https://blog.octo.com/machine-learning-delivery-integrer-la-securite
Écrit sur le blog d’OCTO, cet article aborde le sujet de la sécurité des modèles de machine learning. Il décrit des exemples concrets d’attaques qui impactent vos modèles, il propose ensuite de nombreuses pratiques à mettre en place pour intégrer la sécurité au plus tôt.
2022/05/24 Matrice Cynefin x Machine Learning – Aller vite en production pour minimiser le risque des systèmes complexes
https://blog.octo.com/matrice-cynefin-machine-learning-quand-produire
Écrit sur le blog d’OCTO, cet article croise le cadre conceptuel proposé par Cynefin et le Machine Learning pour décider d’aller rapidement (ou non) en production.
2022/05/10 : Et si les métriques de monitoring de ML devenaient fonctionnalités ?
https://blog.octo.com/et-si-les-metriques-de-monitoring-de-ml-devenaient-fonctionnalites/
Article écrit avec Touraya El Hasssani et Antoine Moreau
Écrit sur le blog d’OCTO, cet article propose de réutiliser les métriques de monitoring en Data Science sous la forme de fonctionnalités.
2022/01/25 : Rendre visible la chaine de valeur dans un projet de Delivery de Machine Learning
https://blog.octo.com/rendre-visible-la-chaine-de-valeur-dans-un-projet-de-ml-delivery/
Article écrit avec Guillaume Pivette
Écrit sur le blog d’OCTO, cet article fait partie de la série “Accélérer le Delivery de projets de Machine Learning” traitant de l’application du modèle Accelerate dans un contexte incluant du Machine Learning. Dans cet article en particulier, nous proposons une approche pour rendre visible et optimiser votre chaîne de création de valeur.
2021/10 : Métiers et Data Scientists doivent collaborer pour concevoir des algorithmes fiables
https://en.calameo.com/books/004800386209709439859
Pages 31-32 dans la revue POLITHEIS, cet article vise à reposer les responsabilités du Data Scientist et du représentant métier dans la conception d’algorithmes fiables.
2021/07/26 : La gestion des données de tests en delivery de Machine Learning
https://blog.octo.com/la-gestion-des-donnees-de-tests-en-delivery-de-machine-learnin/
Écrit sur le blog d’OCTO, cet article fait partie de la série “Accélérer le Delivery de projets de Machine Learning” traitant de l’application du modèle Accelerate dans un contexte incluant du Machine Learning. Dans cet article en particulier, nous proposons des pratiques qui permettrons de tester efficacement.
2021/03/02 : La gestion visuelle dans un projet de Machine Learning Delivery
https://blog.octo.com/la-gestion-visuelle-dans-un-projet-de-machine-learning-delivery/
Article écrit avec Maria Mokbel
Écrit sur le blog d’OCTO, cet article fait partie de la série “Accélérer le Delivery de projets de Machine Learning” traitant de l’application du modèle Accelerate dans un contexte incluant du Machine Learning. Dans cet article en particulier, nous proposons des pratiques pour visualiser le travail en cours et la qualité dans un delivery de Machine Learning.
2021/01/13 : Nos 10 convictions pour mieux réussir nos projets de Data Science en 2021
https://blog.octo.com/reussir-ses-projets-de-data-science-en-2021
Article écrit avec Eric Biernat
Écrit sur le blog d’OCTO, cet article propose 10 orientations que nous constatons début 2021 sur le marché de la Data Science. Méthodologie, organisation, collaboration, amélioration continue sont les thématiques abordées.
2020/05/13 : [MLOps] les difficultés pour récupérer la prédiction idéale
Écrit sur le blog d’OCTO, cet article creuse l’une des difficultés que l’on peut avoir pour suivre la performance réelle d’un algorithme de Data Science : la récupération de la prédiction idéalement faite par l’algorithme pour maximiser l’atteinte de ses objectifs.
2019/12/17 : [MLOps] Une alternative au monitoring de distributions
https://blog.octo.com/une-alternative-au-monitoring-de-distributions/
Article écrit avec Mehdi Houacine
Écrit sur le blog d’OCTO, cet article propose une méthodologie pour obtenir des métriques et des alertes intéressantes sur un système de Data Science. Cette méthodologie a également été présentée à la Duck Conf 2020. Cet article est un des premiers articles français parlant de monitoring de Data Science.
2019/11/20 : Interprétabilité des systèmes de Data Science
https://blog.octo.com/interpretabilite-des-systemes-de-data-science/
Écrit sur le blog d’OCTO, cet article vise à cadrer le problème de l’interprétabilité des systèmes de Data Science. En 3 parties, nous découvrons ce que l’on entend par interprétabilité (pour qui ? pourquoi ? quoi ? et sous quel effort ?) puis nous explorons les raisons de la non-interprétabilités, finalement nous proposons quelques solutions.
2017/10/26 : Benchmark de dataPreparation versus du R standard
https://rpubs.com/ELToulemonde/326980
Écrit sur RPUBS.com, cet article présente les intérêts de la librairie dataPreparation par rapport à du R standard sur une opération classique en préparation de donnée, centrer / réduire les données.
2017/09/14 : De la donnée et de la qualité
https://www.linkedin.com/pulse/de-la-donnée-et-qualité-emmanuel-lin-toulemonde
Écrit sur linkedin, cet article trace les raisons de la non-qualité de donnée et propose 5 actions pour l’améliorer.
2017/08/31 : IA, la fin de l’emploi ?
https://www.linkedin.com/pulse/ia-la-fin-de-lemploi-emmanuel-lin-toulemonde
Écrit sur linkedin, ce billet est une réflexion sur l’impact des différentes révolutions technologiques sur l’emploi, de la révolution agricole à celle de l’intelligence artificielle.