Profil du client et périmètre du projet

Client : Datanumia — filiale du groupe EDF

Secteur : Énergie & Utilities — Solutions digitales pour la maîtrise de la consommation énergétique

Expertise : Data au service de l'IA

Mission : Analytics engineering, modèles de recommandation et optimisation FinOps

Durée : 2024 — 2025

Contexte

Datanumia, filiale du groupe EDF créée en 2021, développe des solutions digitales pour aider les clients EDF — particuliers et professionnels — à réduire leur consommation énergétique et leur empreinte carbone. Pour générer des recommandations pertinentes, Datanumia s'appuie sur un volume important de données de consommation, de profils clients et de paramètres contextuels. Ces données transitent par un Data Warehouse sur Amazon Redshift, mais les transformations manquaient de structure, de généricité et de couverture par des tests — ce qui fragilisait la fiabilité des recommandations produites en aval.

L'enjeu : fiabiliser et industrialiser la chaîne de transformation de données pour alimenter des algorithmes de recommandation robustes, tout en maîtrisant les coûts d'infrastructure.

Résultats clés

1. Pipelines de données industrialisés avec dbt sur Amazon Redshift, de la réception des besoins analytiques jusqu'aux modèles de recommandation

2. Algorithmes de recommandation opérationnels, permettant de générer des conseils personnalisés aux clients EDF pour optimiser leur consommation

3. Optimisation des coûts Redshift par une approche FinOps — rationalisation des requêtes, réduction des temps de run et maîtrise de la facture cloud

La solution

Pour accompagner EDF (via Datanumia) dans l'optimisation énergétique de ses clients, Molia a entièrement restructuré les pipelines de données alimentant les algorithmes de recommandation. En combinant une ingénierie de données rigoureuse (dbt) et une optimisation FinOps systématique sur Amazon Redshift, nous avons fiabilisé les modèles tout en maîtrisant les coûts d'infrastructure cloud. Ce socle robuste permet aujourd'hui de restituer aux ménages des conseils de consommation personnalisés et directement actionnables.

01
02
03
04
01

Structurer les pipelines analytics engineering

Notre consultant a repris et restructuré l'ensemble de la couche de transformation de données. Le travail a couvert la traduction des besoins analytiques en spécifications data, la définition des modèles de données dans le Data Warehouse, puis la création et l'industrialisation des transformations dbt — avec une logique de généricité (macros réutilisables) et de tests unitaires systématiques pour sécuriser chaque run. Ce travail de fond — moins visible que l'algorithme de recommandation lui-même — est ce qui garantit que les données qui l'alimentent sont propres, cohérentes et traçables. Sans cette rigueur en amont, les recommandations générées en aval perdent en pertinence et en fiabilité.

02

Structurer les pipelines analytics engineering

Les pipelines de données structurés par Molia alimentent directement les modèles de recommandation de Datanumia. Ces algorithmes croisent données de consommation, profils de ménages et paramètres contextuels pour produire des recommandations personnalisées — ajustements tarifaires, conseils d'usage, alertes de surconsommation — restituées aux clients EDF via les interfaces de Datanumia. Le rôle de notre consultant a consisté à garantir que les modèles de données en amont fournissent aux algorithmes des inputs fiables, correctement granulés et à jour. C'est la qualité de cette couche intermédiaire qui détermine la pertinence des recommandations pour l'utilisateur final.

03

Optimiser les coûts Redshift — approche FinOps

Amazon Redshift facture à l'usage : le coût de chaque requête dépend de son temps d'exécution, de la quantité de données scannées et de la manière dont les tables sont distribuées et triées. Sur un volume de données en croissance, les coûts d'infrastructure peuvent dériver rapidement si les requêtes ne sont pas optimisées. Notre consultant a conduit un travail systématique d'optimisation des runs Redshift : réécriture des requêtes les plus coûteuses, révision des stratégies de distribution et de tri des tables, réduction des scans inutiles. Cette approche FinOps a permis de maîtriser la facture cloud sans compromettre la performance des pipelines — un équilibre qui devient critique à mesure que les volumes de données augmentent.

04

Restituer les données aux utilisateurs finaux

L'objectif final du projet est concret : aider les ménages à réduire leur consommation d'énergie. Les données transformées et les sorties des algorithmes de recommandation sont restituées aux clients EDF sous forme de visualisations claires et actionnables — tableaux de bord de suivi de consommation, comparaisons personnalisées, recommandations d'optimisation. Ce travail de data visualisation traduit la complexité des données en informations compréhensibles par des utilisateurs non techniques, là où réside la valeur métier du dispositif.

Stack technique — Datanumia (groupe EDF)

L'architecture repose sur la fiabilisation et l'industrialisation de la chaîne de transformation de données :

  • Data Warehouse : Amazon Redshift
  • Transformation & modélisation : dbt (macros réutilisables, tests unitaires systématiques, CI/CD)
  • Optimisation : approche FinOps Redshift — réécriture des requêtes coûteuses, révision des stratégies de distribution et de tri des tables
  • Output : alimentation des algorithmes de recommandation de consommation énergétique + data visualisation pour les utilisateurs finaux EDF

Le savoir-faire Molia

Ce projet illustre un savoir-faire Molia souvent sous-estimé : l'analytics engineering appliquée à un cas d'usage à fort impact. La valeur ne réside pas uniquement dans l'algorithme de recommandation, mais dans la fiabilité de la chaîne de données qui l'alimente — de la spécification des besoins jusqu'à l'optimisation des coûts d'exécution. C'est cette maîtrise de bout en bout, de la transformation dbt à l'approche FinOps, qui permet de déployer des systèmes de recommandation robustes à grande échelle.

Témoignage client

" Molia nous a apporté une expertise en Analytics Engineering permettant d'accélérer nos projets prioritaires. Les pipelines sont maintenant industrialisés, les tests systématiques, et l'optimisation Redshift nous a donné une meilleure visibilité sur nos coûts réels. C'est ce socle qui nous permet aujourd'hui de faire évoluer nos algorithmes de recommandation en toute sécurité. "

Simon Gouvert, Data Team Lead | Datanumia Groupe EDF

Brevo

Développement d’un système d’agents IA pour automatiser et améliorer le support client.
En savoir plus

Agentic AI

Tessi

Audit algorithmique et définition d'une roadmap IA agentique pour optimiser le traitement documentaire à l'échelle.
En savoir plus

Document AI