Le processus opérationnel à mesurer : commandes, visites, souscriptions.
Le contexte qui rend les statistiques lisibles : client, produit, date, canal.
Identifier les sources et extraire vers une zone intermédiaire.
Encoder, nettoyer, joindre et structurer les données.
Charger vers la base cible pour les requêtes analytiques.
Contrôler exactitude, cohérence et fiabilité avant usage.
Le flux peut être montré avec SQLite pour la base, Streamlit pour l'interface et Docker pour figer l'environnement.
SELECTextraire
INSERTajouter
UPDATEmodifier
DELETEsupprimer
CREATE TABLEstructurer
JOINrelier
SELECT d.month, SUM(f.amount) AS ca
FROM fact_orders f
JOIN dim_date d ON f.date_id = d.id
GROUP BY d.month
ORDER BY d.month;
SQL permet de passer d'une base relationnelle à une question métier mesurable.
Une commande reste un événement isolé.
On sait quel segment, pays ou produit explique le résultat.
La démo démarre pareil sur Windows, macOS ou Linux.
Streamlit, drivers et scripts restent dans un conteneur.
Une commande lance l'application et la base SQLite.
On garde cette partie comme contexte d'environnement, sans entrer dans le cycle de vie MLOps.
Charger des données opérationnelles dans SQLite, les transformer, puis exposer des KPI dans Streamlit.
Créer les tables sources et dimensions.
Écrire les requêtes de jointure et d'agrégation.
Afficher les KPI et filtres métier dans Streamlit.