
Data journalisme
Analyse et traitement de bases de données pour l'information.
Édition 2026 – Réforme LMD – Enseignement supérieur et universitaire en RDC.
- Code Officiel : DAJ1121
- Domaine : Sciences et Technologie
- Filière : Informatique
- Mention : Communication Numérique
- Année d’étude : Licence 1
- Semestre : Semestre 2
Consulter les Modalités, Compétences et Débouchés
Cette Unité d’Enseignement (UE), valorisée à 4 crédits ECTS, est conçue comme un pilier fondamental de votre parcours. Son architecture est équilibrée autour de deux Éléments Constitutifs (EC) indissociables, chacun doté de 2 crédits. D’une part, l’Introduction à l’étude du droit vous fournira le socle normatif indispensable à toute manipulation d’information. D’autre part, l’Introduction à l’économie vous donnera les clés de lecture des grands mécanismes financiers et sociétaux qui génèrent les données que vous analyserez, créant ainsi une synergie intellectuelle puissante entre la règle et le chiffre.
Au-delà des savoirs théoriques, cette UE vise à forger des compétences opérationnelles de haute valeur. Vous apprendrez à transformer le chaos informationnel en clarté en maîtrisant l’extraction et l’analyse de bases de données massives pour des fins d’investigation pointue. L’objectif n’est pas seulement de trouver l’information, mais de la faire parler : vous développerez la capacité de concevoir une visualisation interactive des données, rendant les conclusions les plus complexes instantanément compréhensibles. L’ensemble de ces pratiques sera systématiquement ancré dans le respect scrupuleux du cadre légal et économique, garantissant une démarche éthique et professionnelle en toutes circonstances.
Cette formation prépare activement à des métiers d’avenir, au cœur de la transformation numérique. Vous serez profilé pour devenir Data Journaliste, capable de révéler des vérités cachées dans les chiffres ; Analyste de données médiatiques, apte à orienter les stratégies éditoriales par la preuve ; ou encore Concepteur de visualisations de données, véritable architecte de la compréhension. Sur le marché de l’emploi en RDC, ces profils sont cruciaux : ils sont les garants d’une information vérifiée face à la désinformation, des acteurs clés pour analyser les enjeux du développement économique local et des facilitateurs de transparence, essentiels à la consolidation d’un débat public éclairé et d’une économie dynamique.
- PRÉLIMINAIRES
- Chapitre I. Fondations Éthiques, Juridiques et Statistiques
- Chapitre II. Acquisition et Structuration des Données Publiques
- Chapitre III. Méthodologie d’Analyse et d’Investigation
- Chapitre IV. Narration Visuelle et Communication d’Impact
- Chapitre V. Cadre Économique, Diffusion et Impact de l’Enquête
- ANNEXES
PRÉLIMINAIRES
I. Épistémologie et Enjeux Scientifiques du Domaine
Héritage direct du journalisme de précision théorisé par Philip Meyer dans les années 1970, le data journalisme constitue une rupture méthodologique majeure. Il substitue l’intuition anecdotique par une investigation systématique des données brutes, transformant le journaliste en un enquêteur doté de compétences quasi-scientifiques. Cette discipline hybride se situe à la confluence de la statistique, de l’informatique et des sciences sociales. Son enjeu fondamental est de rendre intelligible la complexité du monde contemporain, en exhumant des structures et des corrélations invisibles à l’œil nu pour nourrir un débat public factuellement éclairé.
II. Cartographie des Compétences et Transversalité
La maîtrise du data journalisme exige l’orchestration de trois pôles de compétences distincts mais indissociables. L’extraction et l’analyse de bases de données massives forment le socle technique, requérant une logique algorithmique et une rigueur statistique. La visualisation interactive des données relève, quant à elle, d’une compétence sémiotique et narrative, visant à traduire la complexité en récits clairs et percutants. Enfin, le respect scrupuleux du cadre légal et économique ancre la pratique dans une éthique professionnelle absolue, protégeant à la fois les sources, les sujets et la crédibilité du média.
III. Alignement Stratégique avec les Réalités Opérationnelles
Face à la prolifération des données publiques et privées en Afrique, les métiers de data journaliste et d’analyste de données médiatiques deviennent stratégiques. Ces profils sont essentiels pour auditer l’action publique, suivre l’exécution des budgets, ou encore documenter les impacts socio-environnementaux des industries extractives. En formant des professionnels capables de transformer des tableurs complexes en articles d’investigation à fort impact, cette Unité d’Enseignement répond à un besoin criant de transparence et de redevabilité. Elle arme la future génération de communicateurs pour un journalisme de service public, économiquement viable et socialement indispensable.
Chapitre I. Fondations Éthiques, Juridiques et Statistiques
I.1 Définition et Périmètre du Data Journalisme
Ancré dans une démarche de vérification factuelle, le data journalisme est la discipline qui applique les méthodes fondamentales de l’analyse de données au processus journalistique. Il ne s’agit pas de produire des graphiques, mais de poser des hypothèses et de les tester rigoureusement à l’aide de jeux de données. Cette approche structure l’enquête, de la collecte à la narration, en passant par le nettoyage et l’interrogation des informations. L’objectif est de produire des récits originaux, solidement étayés, qui révèlent des tendances ou des anomalies d’intérêt public.
I.2 Socle Statistique et Logique pour l’Investigation
Sous l’angle de la rigueur analytique, la maîtrise des concepts statistiques de base est non négociable. Ce segment installe les notions vitales de moyenne, médiane, écart-type, corrélation et causalité, en insistant sur les pièges interprétatifs. L’étudiant apprendra à utiliser des tableurs (Excel, LibreOffice Calc) comme premier outil d’analyse exploratoire pour segmenter, filtrer et agréger des données. La finalité est de forger un scepticisme méthodique, permettant de distinguer une véritable information d’un artefact statistique ou d’une coïncidence numérique sans signification journalistique.
I.3 Le Droit à l’Information et la Responsabilité Pénale
Dictée par le cadre légal, la pratique du data journalisme engage la responsabilité du journaliste à plusieurs niveaux. Ce volet décortique les principes fondamentaux du droit de la presse, notamment la diffamation, le respect de la vie privée et le secret des sources, en les adaptant au contexte du traitement de données personnelles. L’analyse se concentre sur la jurisprudence congolaise et les standards internationaux. L’étudiant devra savoir évaluer la balance entre le droit du public à l’information et la protection des individus, une compétence juridique essentielle avant toute publication.
I.4 Application : Audit Critique d’un Communiqué Chiffré
Face à une communication officielle d’un ministère ou d’une entreprise en RDC, le premier réflexe du data journaliste est la défiance méthodique. Cette mise en situation pratique consiste à prendre un communiqué de presse réel annonçant des chiffres de production ou des indicateurs de performance. L’étudiant devra appliquer les concepts statistiques pour questionner la validité des pourcentages, rechercher les données brutes sous-jacentes et identifier les angles morts. L’exercice vise à développer l’aptitude à déconstruire un narratif chiffré et à formuler des questions pertinentes.
Chapitre II. Acquisition et Structuration des Données Publiques
II.1 Écosystème des Données Ouvertes (Open Data)
Conceptualisé pour renforcer la transparence démocratique, l’Open Data désigne les données produites par les gouvernements et rendues accessibles à tous, sans restriction de droit d’auteur. Ce sous-chapitre cartographie les portails de données nationaux et internationaux (Banque Mondiale, agences onusiennes) pertinents pour le contexte africain. L’enjeu est de comprendre la nature, la qualité et la granularité des jeux de données disponibles. L’étudiant apprendra à naviguer dans ces vastes entrepôts d’informations pour identifier des sources fiables et exploitables pour une enquête journalistique locale.
II.2 Techniques de Collecte : du PDF au Web Scraping Frugal
Au-delà des portails structurés, l’information est souvent piégée dans des formats non exploitables comme les rapports PDF ou les pages web dynamiques. Cette section initie aux techniques d’extraction de données, en commençant par des outils simples et accessibles comme Tabula pour les PDF. Elle introduit ensuite les principes du web scraping éthique à l’aide d’extensions de navigateur ou de scripts simples, en tenant compte des contraintes de connexion internet. L’objectif est de rendre l’étudiant autonome dans sa capacité à transformer l’information “morte” en bases de données propres et structurées.
II.3 Limites Économiques et Qualitatives des Données Publiques
La disponibilité affichée des données ouvertes masque souvent une réalité plus complexe. Ce segment analyse de manière critique les failles de l’Open Data en Afrique : données obsolètes, incomplètes, erronées ou formatées de manière à décourager leur analyse. Il aborde également le coût économique caché de la collecte et du nettoyage, qui représente jusqu’à 80% du temps d’un projet de data journalisme. Comprendre ces limites est crucial pour évaluer la faisabilité d’une enquête et pour allouer les ressources de manière réaliste au sein d’une rédaction.
II.4 Cas Pratique : Constitution d’une Base de Données sur les Contrats Miniers
En s’appuyant sur les publications de l’Initiative pour la Transparence dans les Industries Extractives (ITIE) en RDC, les étudiants devront mener un projet concret. La mission consiste à collecter, agréger et nettoyer les données issues de différents rapports annuels (souvent en PDF) pour construire une base de données unifiée sur les paiements des entreprises minières à l’État. Cet exercice pratique confronte l’apprenant aux défis réels de l’harmonisation de données hétérogènes et démontre l’utilité directe de la compétence pour le journalisme d’investigation économique.
Chapitre III. Méthodologie d’Analyse et d’Investigation
III.1 Le Nettoyage et la Préparation : Principe du “Tidy Data”
Théorisé par Hadley Wickham, le concept de “Tidy Data” impose une structure rigoureuse comme prérequis à toute analyse fiable : chaque variable forme une colonne, chaque observation une ligne. Ce module est entièrement consacré à cette étape cruciale. Il enseigne les méthodes pour identifier et corriger les erreurs de saisie, standardiser les catégories, et traiter les données manquantes. L’étudiant utilisera des outils comme OpenRefine pour automatiser ces tâches répétitives, une compétence fondamentale pour garantir l’intégrité et la robustesse de l’analyse journalistique qui en découlera.
III.2 Interrogation des Données : Filtrage, Tri et Tableaux Croisés Dynamiques
Une fois les données propres, l’investigation peut commencer. Cette section se concentre sur les techniques d’interrogation au sein d’un tableur, l’outil le plus accessible. L’étudiant apprendra à maîtriser les fonctions de filtrage avancé, de tri multi-niveaux et, surtout, la puissance des tableaux croisés dynamiques. Ces derniers permettent de synthétiser des milliers de lignes d’information en tableaux agrégés pour explorer les relations entre différentes variables, poser des questions et faire émerger les premiers angles d’articles potentiels à partir des tendances observées.
III.3 Biais Cognitifs et Erreurs d’Interprétation en Analyse
L’analyse de données est un terrain miné de pièges cognitifs. Ce volet expose les biais les plus courants qui menacent le data journaliste : le biais de confirmation (chercher ce qui confirme son hypothèse), l’apophénie (voir des motifs là où il n’y en a pas), ou la confusion entre corrélation et causalité. En s’appuyant sur des exemples célèbres d’erreurs d’interprétation médiatique, l’objectif est de développer une hygiène intellectuelle. L’étudiant apprendra à systématiquement questionner ses propres résultats et à collaborer pour valider ses conclusions.
III.4 Application : Analyse d’une Base de Dépenses Publiques à Kinshasa
À partir d’un jeu de données anonymisé simulant les dépenses d’une administration publique kinoise, les étudiants devront mener une analyse complète. La mission est d’appliquer les techniques de nettoyage et d’interrogation pour identifier des anomalies : dépenses récurrentes inhabituelles, fournisseurs concentrant un volume suspect de contrats, ou pics de dépenses avant une échéance électorale. L’exercice ne vise pas à conclure à la corruption, mais à formuler des hypothèses d’enquête précises et factuellement fondées, prêtes à être transmises à un journaliste de terrain.
Chapitre IV. Narration Visuelle et Communication d’Impact
IV.1 Fondements de la Sémiotique Graphique
La visualisation de données est un langage avec sa propre grammaire et son propre vocabulaire, formalisés par des théoriciens comme Jacques Bertin. Ce sous-chapitre introduit les “variables visuelles” (position, taille, forme, couleur) et explique comment les combiner pour coder l’information de manière efficace et non ambiguë. L’enjeu est de comprendre la psychologie de la perception pour guider l’œil du lecteur et hiérarchiser l’information. L’étudiant apprendra à choisir le type de graphique (barres, lignes, points) le plus pertinent en fonction de la nature des données et du message à transmettre.
IV.2 Outils de Visualisation Interactifs et Statiques
Des infographies pour les réseaux sociaux aux tableaux de bord explorables, la palette d’outils de visualisation est vaste. Cette section propose un panorama pragmatique des solutions adaptées au contexte africain, en privilégiant les outils en ligne gratuits et ne nécessitant pas de code, comme Datawrapper ou Flourish. L’étudiant réalisera des exercices pratiques pour transformer un tableau de chiffres bruts en une série de graphiques clairs, esthétiques et interactifs. L’accent est mis sur la production rapide de visuels prêts à être intégrés dans un article en ligne.
IV.3 L’Éthique de la Visualisation : entre Simplification et Manipulation
Un graphique peut informer, mais il peut aussi mentir. Ce segment critique analyse les techniques, intentionnelles ou non, qui mènent à des visualisations trompeuses : troncature des axes, usage de cartes choroplèthes non normalisées, ou choix de couleurs induisant une interprétation biaisée. En étudiant des cas concrets de désinformation par le graphique, l’étudiant forgera une conscience éthique. Il devra être capable non seulement de produire des visualisations honnêtes, mais aussi d’identifier et de dénoncer celles qui sont manipulatrices dans le débat public.
IV.4 Scénarisation : Construire un Récit Visuel sur l’Accès à l’Eau Potable
Le défi ici est de transformer une base de données sur les points d’accès à l’eau potable en RDC en un récit visuel percutant. Les étudiants devront scénariser leur histoire en combinant texte, cartes et graphiques. L’objectif est de produire un “scrollytelling” simple qui montre les disparités régionales, l’évolution dans le temps et la corrélation avec des indicateurs de santé publique. Ce projet de synthèse oblige à articuler analyse de données, choix graphiques et techniques narratives pour maximiser l’impact émotionnel et informatif sur le public cible.
Chapitre V. Cadre Économique, Diffusion et Impact de l’Enquête
V.1 Modèles Économiques du Journalisme de Données
Produire du data journalisme de qualité est coûteux en temps et en compétences. Ce volet explore les modèles économiques qui permettent de financer ce type d’investigation. Il analyse les stratégies mises en place par des pure-players africains et internationaux : financement par des fondations, abonnements premium, diversification des revenus (formations, consulting), ou encore journalisme de solutions soutenu par des ONG. L’étudiant comprendra les arbitrages économiques nécessaires pour préserver l’indépendance éditoriale tout en assurant la pérennité de la rédaction dans un marché médiatique concurrentiel.
V.2 Stratégies de Diffusion Multi-canaux et Mesure d’Impact
Une enquête n’a de valeur que si elle est lue et provoque un changement. Cette section aborde les stratégies de diffusion modernes, au-delà du simple article web. Elle traite de l’adaptation des formats pour les réseaux sociaux (vidéos courtes, infographies), de la collaboration avec les radios communautaires pour atteindre les zones non connectées, et de l’organisation d’événements pour présenter les résultats. L’étudiant apprendra également à définir des indicateurs de succès (KPIs) qualitatifs et quantitatifs pour mesurer l’impact réel de son travail journalistique.
V.3 Droit de la Personnalité et Anonymisation des Données
La publication d’une enquête basée sur des données personnelles soulève des questions juridiques complexes, notamment au regard du droit à l’oubli et de la protection de la vie privée. Ce segment technique et juridique détaille les méthodes d’anonymisation et de pseudonymisation des jeux de données. Il explique comment agréger l’information pour révéler une tendance sans exposer les individus. L’étudiant apprendra à appliquer ces techniques pour se conformer aux standards éthiques et légaux, minimisant ainsi les risques de poursuites judiciaires pour le média.
V.4 Simulation Finale : Publication d’une Enquête sur le Secteur de la Santé
Ce projet intégrateur final simule le processus complet de publication. En se basant sur les analyses et visualisations des chapitres précédents, les étudiants devront rédiger un article d’investigation final. Ils devront y joindre une note juridique évaluant les risques de diffamation, un plan de diffusion multi-canaux adapté au public congolais, et une proposition de modèle économique pour financer de futures enquêtes similaires. Cet exercice valide la maîtrise de l’ensemble des compétences de l’UE, du traitement des données à la stratégie de publication.
ANNEXES
A. Datawrapper : Création de Visualisations sans Code
Datawrapper est un service en ligne freemium qui s’impose comme l’outil de prédilection du data journaliste moderne pour sa rapidité et sa simplicité. Il permet de transformer en quelques clics un simple tableau de données (copié-collé depuis un tableur) en graphiques (barres, lignes, camemberts) et cartes interactives de haute qualité, prêts à être intégrés sur un site web. Pour un analyste de données médiatiques en RDC, sa faible courbe d’apprentissage et son accessibilité via un simple navigateur en font la solution idéale pour produire rapidement des visuels professionnels.
B. OpenRefine : Nettoyage et Harmonisation de Données Massives
Anciennement Google Refine, OpenRefine est un logiciel libre et gratuit qui s’exécute localement sur l’ordinateur, le rendant résilient aux coupures d’internet. Son rôle est chirurgical : il excelle dans le nettoyage de données “sales” et hétérogènes. Pour un data journaliste traitant des listes de noms, des lieux ou des entreprises, il permet de détecter les variations orthographiques (“Kinshasa”, “Kin”, “Kinshassa”) et de les fusionner en un clic. Sa puissance de “clustering” en fait un outil indispensable pour préparer une base de données avant toute analyse sérieuse.
C. QGIS : Analyse et Cartographie Géospatiale
QGIS est le standard mondial des Systèmes d’Information Géographique (SIG) open source. Pour un concepteur de visualisations de données en Afrique, sa maîtrise est un atout majeur. Il permet de dépasser les cartes de base pour réaliser des analyses spatiales complexes : croiser la carte des concessions minières avec celle des aires protégées, analyser la proximité des écoles par rapport aux villages, ou visualiser la propagation d’une épidémie. C’est l’outil par excellence pour raconter des histoires où la géographie est une variable explicative centrale, une réalité omniprésente sur le continent.
Comment appliquer les principes de l’open data quand l’information étatique est volontairement opaque ou simplement inexistante ?
📚 Source :Travaux de Amartya Sen sur Capability Approach via JSTOR
Comment des visualisations de données complexes peuvent-elles rester efficaces auprès d’audiences à faible littératie numérique ?
📚 Source :Travaux de Edward Tufte sur Data-Ink Ratio via Google Scholar
Pendant une épidémie de choléra au Kivu, comment vérifier rapidement des données de santé sans sources officielles ?
📚 Source :Travaux de Norman Denzin sur Triangulation via Cairn.info
Au-delà de la collecte, comment un data-journaliste peut-il éthiquement cadrer un récit sur les minerais en RDC ?
📚 Source :Travaux de Judith Butler sur Frames of War via Wikipedia (FR)
Discussion (0)
Aucune intervention pour le moment. Soyez le premier à contribuer.
Votre intervention Annuler la réponse