Model platform

https://github.com/octo-technology/model_platform

La Model Platform est une plateforme MLOps open source qui permet aux Data Scientist de gérer les versions, de déployer, d’héberger et de contrôler les modèles d’apprentissage automatique sur Kubernetes avec un minimum de configuration. Elle comble le fossé entre l’entraînement des modèles (MLflow) et la mise en production, tout en générant la documentation de conformité désormais exigée par l’IA Act.

En tant que contributeur, j’ai participé au design et au développement de la plateforme.

dataPreparation une librairie R pour faciliter la préparation de données

Github actions codecov CRAN_Status_Badge

https://github.com/ELToulemonde/dataPreparation

Depuis 2017, Emmanuel-Lin Toulemonde construit et maintient dataPreparation. C’est une librairie open source en R qui vise à simplifier la préparation de données tabulaires pour les projets de Data Science. Cette librairie se veut rapide, parcimonieuse en RAM, stable et verbeuse. Fin 2021, sa 16ème version a été publiée et elle atteint les 95 000 téléchargements.

pytesseract une librairie python pour l’OCR

https://github.com/madmaze/pytesseract

Pytesseract est une librairie python permettant la reconnaissance de texte dans les images. Emmanuel-Lin Toulemonde a contribué à l’occasion de 2 pull requests. Une pour faciliter la vie des utilisateurs, une pour résoudre un bug.

Stackoverflow : répondre aux questions de la communauté

https://stackoverflow.com/users/5227259/emmanuel-lin

Une soixantaine de réponses à des questions concernant la manipulation de données en R et en python.