
Analyse et Traitement des données
Fouille de données et conception d'outils décisionnels.
Édition 2026 – Réforme LMD – Enseignement supérieur et universitaire en RDC.
- Code Officiel : ATD1352,
- Domaine : Domaine de Sciences Economiques et de Gestion
- Filière : Gestion Commerciale et Administrative
- Année d’étude : Non spécifié
- Diplôme attendu : [Bachelor en Gestion Commerciale et Administrative
Voir la suite de la fiche
- Mention : Informatique de Gestion
- Semestre : Semestre 5
- Crédits totaux : Non spécifié
- Détail des EC :
- [1 EC : EC1 Informatique décisionnelle et forage des données: Intelligence d'affaires
- MS Excel avancé et MS Access avancé (Crédits : 4
- CM : 40h
- TD : 5h
- TP : 15h
- Total présentiel : 60h
- TPE : 40h)
- Pas d'options]
- Volume Horaire : CMI : [40]h, TD : [5]h, TP : [15]h, Total présentiel : [60]h
🎯 Compétences visées :
- [Mener le processus d'analyse
💼 Métiers cibles :
- [Analyste programmeur
- Concepteur et administrateur des bases de données
- Technicien et administrateur de réseaux
- Analyste des systèmes d'information
- Analyste des données et d'affaires
- Entrepreneur]
PRÉLIMINAIRES
I. Contexte et Justification de l’UE
La transformation numérique de l’économie congolaise impose une maîtrise accrue de son principal actif : la donnée. Cette Unité d’Enseignement est conçue pour répondre à ce besoin critique en formant des gestionnaires capables de transformer les données brutes en intelligence décisionnelle. Face à la complexité des marchés locaux, de la gestion des ressources minières à la logistique du commerce de détail à Kinshasa, la capacité à analyser et modéliser devient un avantage compétitif non négociable pour la performance des organisations.
II. Compétences Visées et Débouchés Professionnels
L’objectif central est de doter l’étudiant de la compétence fondamentale de “mener le processus d’analyse de données”. Ceci se décline en la capacité à collecter, nettoyer, modéliser, analyser et présenter des données pour éclairer la stratégie d’entreprise. Les diplômés seront immédiatement opérationnels pour des postes d’Analyste de données, d’Analyste d’affaires ou de Concepteur de bases de données, répondant à une demande croissante dans les secteurs bancaire, des télécommunications et des industries extractives en RDC.
III. Approche Pédagogique et Modalités d’Évaluation
Adoptant une pédagogie active et par projet, ce cours privilégie l’apprentissage par la pratique (“learning by doing”). Les concepts théoriques sont systématiquement appliqués à travers des études de cas concrets issus du tissu économique congolais. L’évaluation combine un contrôle continu basé sur des travaux pratiques (TP) sur MS Excel et Access, et un examen final intégrant la résolution d’un problème d’affaires complexe, simulant une mission de consultation en analyse de données.
IV. Prérequis Techniques et Conceptuels
Une maîtrise fonctionnelle de l’environnement informatique Windows est indispensable. L’étudiant doit faire preuve d’une pensée logique et structurée, et posséder des connaissances de base en mathématiques et statistiques descriptives. Une familiarité préalable avec les concepts fondamentaux de la gestion d’entreprise (marketing, finance, logistique) constitue un atout majeur pour contextualiser les analyses et garantir la pertinence managériale des solutions développées au cours du semestre.
PARTIE 1 : FONDAMENTAUX DE LA DONNÉE ET OUTILS D’ANALYSE STRUCTURÉE
Chapitre I. L’Intelligence d’Affaires : Le Levier Stratégique
I.1 Du concept de donnée à l’intelligence décisionnelle
Du simple fait brut à la sagesse stratégique, la donnée suit un parcours de valorisation rigoureux. Ce sous-chapitre déconstruit la pyramide DIKW (Data, Information, Knowledge, Wisdom) en l’appliquant au contexte d’une entreprise de distribution de Kinshasa. Il s’agit de comprendre comment des tickets de caisse (données) se transforment en rapports de ventes (information), puis en compréhension des habitudes d’achat (connaissance) pour enfin optimiser les stocks et les promotions (sagesse).
I.2 Architecture d’un système d’information décisionnel (SID)
Face à la dispersion des sources de données, l’architecture d’un SID unifie la vision de l’entreprise. Cette section modélise les composants essentiels : les sources opérationnelles (ERP, CRM), la zone de préparation (ETL), l’entrepôt de données (Data Warehouse) et les outils de restitution. Nous illustrons cette architecture par le cas d’une banque congolaise intégrant les données de ses agences, de ses distributeurs automatiques et de ses services de mobile money pour obtenir une vue client à 360°.
I.3 Le processus ETL (Extract, Transform, Load) : Le cœur du réacteur
Une connaissance approfondie des dynamiques ETL est la garantie de la fiabilité de toute analyse. Ce point détaille les trois phases critiques : l’extraction depuis des sources hétérogènes, la transformation (nettoyage, standardisation, enrichissement) pour assurer la qualité, et le chargement dans l’entrepôt de données. L’application pratique portera sur l’automatisation du traitement des rapports de production d’un site minier du Katanga pour fiabiliser le reporting destiné au siège social.
I.4 Panorama des outils et positionnement dans l’écosystème congolais
Dans un écosystème numérique congolais en pleine mutation, le choix des outils est stratégique. Ce segment cartographie le paysage des solutions de Business Intelligence, de MS Excel et Access, accessibles et omniprésents, aux plateformes spécialisées comme Power BI ou Tableau. L’analyse se concentre sur le coût, la courbe d’apprentissage et l’adéquation des outils aux besoins spécifiques des PME et grandes entreprises opérant en RDC, justifiant le focus initial sur la suite Microsoft.
Chapitre II. MS Excel : De la Feuille de Calcul à l’Outil d’Analyse Avancé
II.1 Fonctions avancées, formules matricielles et validation des données
Sous l’angle de la robustesse analytique, la maîtrise des fonctions avancées transforme Excel en un puissant calculateur. Ce sous-chapitre explore les fonctions logiques, de recherche (RECHERCHEV/X), statistiques et financières, ainsi que la puissance des formules matricielles pour des calculs complexes sur des plages de données. L’application portera sur la création d’un tableau de bord automatisé pour le suivi des performances commerciales d’une force de vente à Lubumbashi, avec des règles de validation strictes.
II.2 Les Tableaux Croisés Dynamiques (TCD) pour l’exploration multidimensionnelle
Véritable moteur d’analyse multidimensionnelle intégré à Excel, le TCD permet de synthétiser et d’explorer de vastes jeux de données de manière interactive. Cette section enseigne la construction, la manipulation et la personnalisation des TCD pour révéler des tendances cachées. Nous utiliserons un jeu de données sur la logistique des produits agricoles pour analyser les volumes et les coûts de transport entre le Kongo-Central et les marchés de Kinshasa, en croisant plusieurs dimensions.
II.3 L’outil Power Query : Automatisation du nettoyage et de la transformation
Face aux défis de données hétérogènes et mal structurées, Power Query est la solution ETL intégrée à Excel. Ce point technique démontre comment automatiser l’intégralité du processus de nettoyage et de préparation des données sans écrire une seule ligne de code. L’étudiant apprendra à fusionner plusieurs fichiers, à dé-pivoter des tableaux et à standardiser des formats pour préparer un reporting mensuel fiable à partir de sources multiples et non standardisées.
II.4 Introduction à la modélisation avec Power Pivot et le langage DAX
Dépassant les limites du TCD classique, Power Pivot introduit la modélisation de données relationnelles au sein même d’Excel. Ce sous-chapitre initie à la création d’un modèle de données en établissant des relations entre plusieurs tables et à l’écriture des premières mesures en langage DAX (Data Analysis Expressions). L’objectif est de construire un modèle de rentabilité produit pour une PME de Goma, en calculant des indicateurs de performance (KPIs) impossibles à obtenir avec des formules standards.
Chapitre III. MS Access : Structuration et Gestion des Données Relationnelles
III.1 Principes de la modélisation relationnelle (MCD/MLD)
Fondement de toute base de données robuste, la modélisation conceptuelle (MCD) et logique (MLD) assure la cohérence et l’évolutivité du système. Cette section présente les concepts d’entité, d’attribut, de relation et de cardinalité. L’exercice pratique consistera à concevoir le modèle de données pour une application de gestion des stocks d’une pharmacie à Matadi, en identifiant correctement les entités (Produits, Fournisseurs, Ventes) et leurs liens pour éviter toute redondance.
III.2 Création de tables, relations et garantie de l’intégrité référentielle
Sous l’angle de la fiabilité des données, la mise en œuvre physique du modèle dans Access est une étape cruciale. Ce point guide l’étudiant dans la création des tables, la définition des types de données, des clés primaires et des clés étrangères. Une attention particulière est portée à l’instauration de l’intégrité référentielle pour empêcher la création d’enregistrements orphelins, garantissant ainsi que chaque vente corresponde à un client et à un produit existants.
III.3 Le langage SQL (Structured Query Language) pour l’interrogation des données
Une maîtrise du langage SQL confère le pouvoir d’interroger précisément n’importe quelle base de données relationnelle. Ce sous-chapitre se concentre sur les commandes fondamentales de la clause SELECT pour filtrer (WHERE), trier (ORDER BY) et agréger (GROUP BY) les données. L’étudiant apprendra à rédiger des requêtes pour extraire des informations métiers spécifiques, comme la liste des clients d’une microfinance du Kasaï ayant plus de trois prêts en cours.
III.4 Conception de formulaires de saisie et d’états de synthèse
Pour garantir une adoption par les utilisateurs finaux, une interface intuitive est indispensable. Cette section enseigne la conception de formulaires ergonomiques dans Access pour simplifier la saisie, la modification et la consultation des données, en y intégrant des contrôles et des validations. Il s’agira également de créer des états de synthèse professionnels (factures, listes, rapports) prêts à être imprimés, fournissant une sortie tangible et directement exploitable par la gestion de l’entreprise.
PARTIE 2 : Ingénierie de la Donnée et Intelligence d’Affaires
Chapitre IV. Modélisation et Manipulation Avancée des Données
IV.1 Maîtrise du processus ETL avec Power Query
Face aux défis de l’hétérogénéité des sources de données en RDC (fichiers textes, Excel, bases de données), Power Query s’impose comme l’outil ETL (Extract, Transform, Load) intégré à Excel. Ce module enseigne la connexion à des sources multiples, le nettoyage et la transformation de données brutes (gestion des erreurs, fusions, fractionnements) pour construire un jeu de données propre et fiable, prérequis indispensable à toute analyse pertinente pour une PME de Kinshasa ou une administration provinciale.
IV.2 Construction de modèles de données avec Power Pivot et DAX
Au-delà des simples tableaux croisés dynamiques, Power Pivot permet de créer des modèles de données relationnels complexes au sein même d’Excel. L’accent est mis sur la création de relations entre tables, l’optimisation du modèle et l’introduction au langage DAX (Data Analysis Expressions). L’étudiant apprendra à formuler des indicateurs de performance (KPIs) sophistiqués, tels que le calcul de marges commerciales évolutives pour un importateur de Lubumbashi, dépassant les limites d’Excel natif.
IV.3 Conception de bases de données relationnelles sous MS Access
Une architecture de données robuste est le socle de toute application de gestion fiable. Ce point couvre les principes de la modélisation relationnelle (entités, attributs, relations) et leur implémentation concrète dans MS Access. L’étudiant concevra une base de données normalisée (jusqu’à la 3FN) pour gérer, par exemple, le stock et les ventes d’une pharmacie à Matadi, garantissant l’intégrité des données et évitant la redondance, un enjeu majeur pour la pérennité des systèmes d’information.
IV.4 Interopérabilité et automatisation entre Access et Excel
L’interopérabilité entre outils décuple leur puissance. Cette section se concentre sur les techniques d’intégration dynamique entre la base de données Access (le back-end robuste pour la saisie et le stockage) et Excel (le front-end flexible pour l’analyse et la visualisation). L’étudiant réalisera des connexions ODBC, automatisera les mises à jour de rapports et construira des tableaux de bord Excel alimentés en temps réel par une base de données Access, créant ainsi un système décisionnel complet et économique.
Chapitre V. Fondements de l’Intelligence d’Affaires (Business Intelligence)
V.1 Le cycle de vie de la BI et son apport stratégique
Dépassant la simple production de rapports, l’intelligence d’affaires (BI) est un processus stratégique transformant les données brutes en avantage concurrentiel. Ce module détaille les étapes du cycle de la BI, de la collecte des besoins métiers à la diffusion des insights décisionnels. L’application portera sur la manière dont une banque congolaise peut utiliser la BI pour optimiser ses offres de crédit en analysant les profils de ses clients, et non plus en se basant sur l’intuition.
V.2 Architecture et modélisation de l’entrepôt de données (Data Warehouse)
Pivot central de toute stratégie décisionnelle, l’entrepôt de données (Data Warehouse) consolide les informations de sources hétérogènes (comptabilité, ventes, logistique). Nous étudions ici les architectures (Kimball, Inmon) et les techniques de modélisation en étoile ou en flocon pour structurer les données à des fins d’analyse (OLAP). L’étudiant apprendra à concevoir un mini-entrepôt de données pour une société minière du Katanga, intégrant données de production et données financières.
V.3 Principes et mise en œuvre des processus ETL
Sous l’angle de l’ingénierie des flux, le processus ETL (Extract, Transform, Load) est le moteur qui alimente l’entrepôt de données. Ce sous-chapitre décortique chaque phase : l’extraction depuis les systèmes opérationnels, la transformation (nettoyage, standardisation, agrégation) qui est la phase la plus critique et à plus forte valeur ajoutée, et le chargement dans les structures cibles. La maîtrise de ce processus est vitale pour garantir la qualité et la cohérence des données décisionnelles.
V.4 Conception de tableaux de bord et indicateurs de performance (KPI)
La traduction des données brutes en intelligence actionnable se matérialise par les tableaux de bord. Ce point se focalise sur les principes de la visualisation de données (DataViz) et la définition de Key Performance Indicators (KPIs) pertinents pour le contexte local. L’étudiant apprendra à concevoir un tableau de bord pour le suivi des objectifs de vente d’une régie publicitaire à Kinshasa, en choisissant les graphiques adéquats pour une communication claire et un pilotage efficace de la performance.
Chapitre VI. Techniques de Forage de Données (Data Mining) pour l’Aide à la Décision
VI.1 Introduction au forage de données et au processus KDD
Distinct du reporting traditionnel qui décrit le passé, le forage de données (Data Mining) vise à découvrir des modèles prédictifs et des connaissances cachées dans de vastes ensembles de données. Ce module introduit le processus KDD (Knowledge Discovery in Databases) et la méthodologie CRISP-DM, le standard industriel pour mener un projet de data mining. L’objectif est de doter l’étudiant d’un cadre rigoureux pour explorer les données des opérateurs télécoms en RDC et en extraire de la valeur.
VI.2 Méthodes de classification et arbres de décision
La classification constitue une tâche prédictive fondamentale consistant à affecter une observation à une catégorie prédéfinie. Ce sous-chapitre explore les algorithmes d’arbres de décision (ID3, C4.5), réputés pour leur interprétabilité. L’étudiant appliquera cette technique pour construire un modèle prédisant le risque de défaut de paiement d’un client dans une institution de microfinance du Kivu, permettant une prise de décision plus objective et rapide dans l’octroi de microcrédits.
VI.3 Méthodes de segmentation et algorithmes de clustering
À l’inverse de la classification, le clustering est une technique non supervisée qui segmente une population en groupes homogènes sans connaissance a priori des catégories. L’algorithme des K-Means sera étudié et appliqué pour identifier des segments de consommateurs distincts sur le marché de l’eau en bouteille à Kinshasa. Cette segmentation permet ensuite d’adapter les stratégies marketing et de communication pour cibler plus efficacement chaque groupe identifié, optimisant ainsi les ressources.
VI.4 Découverte de règles d’association
Révéler les affinités cachées entre produits ou services est l’objectif des règles d’association, popularisées par l’analyse du panier de la ménagère (“market basket analysis”). Ce module présente l’algorithme Apriori pour extraire des règles du type “Si un client achète du pain, alors il achète aussi du beurre”. L’application pratique portera sur l’optimisation du merchandising et des promotions croisées dans une chaîne de supermarchés de Goma, en se basant sur les tickets de caisse.
ANNEXES
A. Étude de Cas : Optimisation de la Logistique du Cobalt par l’Analyse de Données
Face à la complexité des chaînes d’approvisionnement minières en RDC, cette étude de cas pratique démontre l’application de l’informatique décisionnelle. L’étudiant est guidé pas à pas dans l’analyse d’un jeu de données logistiques (délais, coûts, points de rupture). Le processus aboutit à la création d’un tableau de bord sur MS Excel permettant d’identifier les goulots d’étranglement et de proposer des solutions concrètes pour améliorer l’efficience et la rentabilité des exportations depuis le Katanga.
B. Vade-mecum des Fonctions Avancées Excel pour l’Analyste de Données
Maîtriser les fonctions de recherche, de logique et de statistique d’Excel constitue un avantage concurrentiel direct sur le marché du travail congolais. Ce guide de référence rapide fournit la syntaxe, les cas d’usage et les pièges à éviter pour des fonctions clés (INDEX, EQUIV, SOMME.SI.ENS, RECHERCHEX) et des outils comme les Tableaux Croisés Dynamiques. Il est spécifiquement orienté vers la résolution de problèmes de gestion commerciale : analyse de ventes, segmentation client et suivi de performance.
C. Glossaire Bilingue (Français-Anglais) des Termes de l’Informatique Décisionnelle
Une terminologie précise constitue le fondement de toute expertise technique et facilite l’insertion dans des équipes internationales. Ce glossaire définit rigoureusement les concepts fondamentaux (ETL, Data Warehouse, OLAP, KPI, Dashboard, Data Mining) en fournissant leur équivalent anglais. Sa maîtrise est indispensable pour comprendre la documentation technique, interagir avec des plateformes logicielles et affirmer sa crédibilité professionnelle lors d’échanges avec des partenaires ou employeurs étrangers.
D. Guide de Structuration d’une Base de Données Access pour une PME
Pour une PME de Kinshasa ou de Goma, une base de données bien structurée est le socle d’une croissance maîtrisée. Cette annexe propose un modèle relationnel prêt à l’emploi sur MS Access pour la gestion d’une activité commerciale (clients, produits, commandes, factures). Elle détaille les principes de normalisation (jusqu’à la 3FN), la création de relations et l’importance de l’intégrité référentielle pour garantir la fiabilité des données qui alimenteront les futures analyses décisionnelles.
Discussion (0)
Aucune intervention pour le moment. Soyez le premier à contribuer.
Votre intervention Annuler la réponse