Enjeux
Malgré le développement d’une suite logiciel visant à faciliter et homogénéiser le traitement de la donnée, les utilisateurs se reposent en parallèle sur une grande variété d’outils connexes pour la réalisation de leurs travaux.
Il était nécessaire de reprendre les scripts en s’appuyant sur les outils existants, de sensibiliser à nouveau aux bonnes pratiques et de mettre en place l’écosystème de développement adéquat pour les utilisateurs.
Les contraintes techniques du projet touchaient tant à la variété des formats de données, qu’à leur volume dans l’environnement technique très diversifié en R (version > 3) et/ou Python (version > 3) (traitement de données , accès aux bases de données et API en R , visualisation de données, publication en R, développement de packages en R et de modules en Python, parallélisation de code, développement des API, d’applications web avec R, Outils transverses de développement (Git, Intégration continue, …)).
Gestion de projet, Accompagnement et développement adhoc
Consortia réalise un accompagnement spécifique pour la réussite du projet. L’équipe inclue le savoir-faire d’un PMO Data pour cadrer le travail de l’équipe Data Scientists et assurer partage et transparence sur le travail réalisé.
Cadrage et accompagnement
- Conduite des entretiens techniques avec les utilisateurs, recueil de la matière, partage des rapports intermédiaires et rapports de conclusions
- Rédaction des comptes-rendus des entretiens
- Rédaction de la documentation d’organisation
- Rédaction des supports de communication sur les évolutions des scripts et leur utilisation en respectant les bonnes pratiques
- Espaces de partage organisés, enrichis et maintenus à jour
- Tenue à jour d’un tableau de reporting des activités
Développement des scripts
- Mise au propre des scripts utilisateurs en respectant les bonnes pratiques et en assurant la compatibilité avec la dernière version d’Antares
- Découpage des fonctions importantes en sous-fonctions plus simples
- Développement de tests unitaires des fonctions développées dans les entités
- Uniformisation des noms des fichiers, des scripts mais aussi des objets
- Dépôt du code dans le Gitlab « DEVIN »
- Documentation des fonctions et des formats de données communs qui pourraient être regroupés au sein de packages R
- Intégration à long terme des besoins fonctionnels
200
scripts R restructués
Piloter, réaliser dans une recherche d'accompagnement
Réécriture des scripts
Partant de scripts lourds et peu maintenables, réécriture pour une écriture modulaire, normalisation des dénominations, mise en place de tests unitaires
Utilisation du dépôt de code du client
Malgré une situation initiale marquée par un manque de capitalisation et de partage, construction de scripts référencés et sécurisés grâce à l’utilisation de GitLab
Mise en place de l'écosystème
Mise en place d’un écosystème adapté, permettant la réalisation plus simple des développements grâce au versionning et aux travaux en commun
Accompagnement au changement
- Présentation des résultats des travaux de réécriture des scripts et rappel des bonnes pratiques
- Proposition d’outils et organisation de la communauté des utilisateurs pour inscrire la démarche dans le temps
- Gestion des espaces de partage de la documentation, être force de proposition
- Sensibilisation des utilisateurs pour qu’ils respectent désormais les bonnes pratiques de développement