Open Source
dataPreparation une librairie R pour faciliter la préparation de données
https://github.com/ELToulemonde/dataPreparation
Depuis 2017, Emmanuel-Lin Toulemonde construit et maintient dataPreparation. C’est une librairie open source en R qui vise à simplifier la préparation de données tabulaires pour les projets de Data Science. Cette librairie se veut rapide, parcimonieuse en RAM, stable et verbeuse. Fin 2021, sa 16ème version a été publiée et elle atteint les 95 000 téléchargements.
pytesseract une librairie python pour l’OCR
https://github.com/madmaze/pytesseract
Pytesseract est une librairie python permettant la reconnaissance de texte dans les images. Emmanuel-Lin Toulemonde a contribué à l’occasion de 2 pull requests. Une pour faciliter la vie des utilisateurs, une pour résoudre un bug.
Stackoverflow : répondre aux questions de la communauté
https://stackoverflow.com/users/5227259/emmanuel-lin
Une soixantaine de réponses à des questions concernant la manipulation de données en R et en python.