Statistique descriptive

Utilisation de méthodes quantitatives appliquées aux sciences humaines et documentaires.

Édition 2026 – Réforme LMD – Enseignement supérieur et universitaire en RDC.

Code Officiel : SDH1241
Domaine : Sciences de l'Homme et de la Société
Filière : Sciences Historiques, Gestion du Patrimoine et Développement
Mention : Sciences Historiques, Gestion du Patrimoine et Développement
Année d’étude : Licence 2
Semestre : Semestre 4

Consulter les Modalités, Compétences et Débouchés

Cette unité d’enseignement, valorisée à hauteur de 3 crédits ECTS, s’articule de manière concentrée autour d’un unique Élément Constitutif : La Statistique descriptive ou méthodes quantitatives appliquées en sciences humaines. Cette architecture monobloc assure une immersion complète dans la discipline, avec un volume horaire ajusté de manière pragmatique pour garantir l’atteinte des objectifs pédagogiques sans être contraint par un cadre rigide prédéfini.

La non-spécification du diplôme attendu souligne le caractère fondamental et transversal de cette unité. Elle ne vise pas une certification isolée mais constitue une compétence transversale à haute valeur ajoutée, conçue pour enrichir et renforcer une diversité de parcours académiques. Son intégration confère un avantage concurrentiel significatif à tout diplômé en sciences humaines et sociales, en lui apportant une rigueur méthodologique et une capacité d’analyse quantitative prisées.

Les compétences visées permettent de maîtriser l’intégralité du cycle de vie de la donnée historique, de la collecte et l’épuration de données séculaires complexes à leur interprétation. L’étudiant apprendra à traduire des ensembles de chiffres bruts en récits visuels percutants via la modélisation graphique, rendant l’évolution des sociétés intelligible d’un seul regard. Cette expertise trouve une application directe dans le pilotage de la performance des institutions culturelles, en objectivant la gestion des stocks ou l’analyse des flux de visiteurs.

Les métiers de Technicien de bases de données historiques, Assistant statisticien en sciences humaines, et Analyste de gestion documentaire sont d’une importance stratégique sur le marché de l’emploi congolais. Ces profils sont essentiels pour la valorisation du patrimoine national à travers la numérisation, pour l’aide à la décision au sein des ONG et des administrations publiques, et pour la modernisation des infrastructures de connaissance, jouant ainsi un rôle clé dans le développement et la mémoire collective de la RDC.

PRÉLIMINAIRES

I. Note à l’étudiant en Sciences Historiques et Patrimoniales

Cet ouvrage n’est pas un manuel de mathématiques, mais un arsenal méthodologique. Il est conçu pour vous, futur historien, archiviste ou gestionnaire de patrimoine en RDC, afin de transformer les masses de données qualitatives et quantitatives (archives coloniales, registres paroissiaux, inventaires de musées) en arguments probants et en décisions éclairées. La statistique descriptive est ici l’instrument qui confère à votre analyse une rigueur scientifique et une valeur socio-économique immédiate, vérifiable et communicable.

II. Compétences visées et débouchés en RDC

La maîtrise de ce contenu vous rendra apte à quantifier et analyser des phénomènes socio-historiques. Vous serez capable de produire des rapports sur la fréquentation d’un site culturel, d’analyser l’évolution démographique d’une entité territoriale à partir de sources anciennes, ou d’optimiser la gestion des collections d’une bibliothèque. Ces compétences sont directement valorisables pour des postes de technicien de bases de données historiques, d’analyste pour des ONG évaluant des projets de développement, ou d’assistant de conservation dans les institutions mémorielles congolaises.

III. Méthodologie de l’ouvrage et intégration LMD

Structuré selon les standards du système LMD (CPE-MINESU), ce manuel articule chaque concept théorique à une application pratique immédiate dans le contexte congolais. Chaque chapitre est une brique de compétence menant à l’autonomie. Les exemples sont puisés dans les archives nationales, les réalités des musées de Kinshasa ou Lubumbashi et les problématiques de gestion documentaire locales. L’objectif est de vous rendre opérationnel pour répondre aux besoins concrets du marché du travail en RDC dès la fin du semestre.

PARTIE 1 : FONDEMENTS, COLLECTE ET ORGANISATION DES DONNÉES HISTORIQUES ET DOCUMENTAIRES

Chapitre I. Introduction à la démarche quantitative en sciences humaines

I.1 Nature et objet de la statistique descriptive

Dépassant le cadre purement mathématique, la statistique descriptive fournit un ensemble de techniques pour synthétiser et présenter l’information contenue dans les données. Pour l’historien, elle permet de structurer les récits en quantifiant des tendances, comme l’évolution du commerce du caoutchouc dans l’État Indépendant du Congo. Ce chapitre établit la statistique non comme une fin, mais comme un puissant outil d’investigation et de validation des hypothèses en sciences humaines et sociales.

I.2 Population, individu et caractère

Une distinction fondamentale s’opère entre la population (l’ensemble étudié, ex: les manuscrits d’une bibliothèque), l’individu (un élément de cet ensemble, ex: un manuscrit) et le caractère (la propriété mesurée, ex: le nombre de pages). Maîtriser ce triptyque est le prérequis pour définir rigoureusement le périmètre d’une étude, que ce soit sur les registres de baptême d’une paroisse du Kasaï ou sur l’inventaire des objets d’un musée provincial.

I.3 Variables et échelles de mesure

La formalisation des observations passe par la définition de variables, qui peuvent être qualitatives (nominales, ordinales) ou quantitatives (discrètes, continues). Ce sous-chapitre détaille comment classifier rigoureusement les données : le type d’artefact (qualitatif nominal), le niveau de dégradation d’un document (qualitatif ordinal) ou le nombre de visiteurs par jour (quantitatif discret). Le choix de l’échelle conditionne directement les outils d’analyse pertinents, évitant ainsi les contresens majeurs.

I.4 Éthique de la collecte et du traitement en contexte congolais

Face à la manipulation de données humaines, des principes éthiques stricts s’imposent. Cette section aborde les questions de l’anonymisation des sources orales, du consentement éclairé lors des enquêtes sur le patrimoine immatériel et de l’interprétation non biaisée des données sensibles issues de l’histoire coloniale. L’intégrité de l’analyste est la pierre angulaire de la crédibilité scientifique, particulièrement dans un contexte de reconstruction mémorielle et de cohésion nationale en RDC.

Chapitre II. Acquisition et préparation des données brutes

II.1 Sources de données pour l’historien et le gestionnaire de patrimoine

Au cœur de toute analyse quantitative se trouve la donnée brute. Ce point explore les gisements de données disponibles en RDC : archives nationales (ANAC), registres administratifs provinciaux, bases de données des ONG, inventaires de musées, statistiques de prêt des bibliothèques universitaires (UNIKIN, UNILU). Il s’agit d’apprendre à localiser, évaluer la fiabilité et extraire l’information pertinente de ces sources hétérogènes pour constituer un corpus de travail solide.

II.2 Conception d’instruments de collecte : enquête et questionnaire

Sous l’angle de la pertinence méthodologique, la création d’un bon questionnaire est un art. Ce sous-chapitre enseigne la formulation de questions claires, non-biaisées et adaptées au contexte culturel congolais. L’objectif est de construire un outil capable de collecter des données fiables, par exemple pour mesurer la perception du patrimoine local par les communautés riveraines du Parc National des Virunga ou évaluer les besoins des usagers d’un centre d’archives à Goma.

II.3 Nettoyage et critique des données : détection des erreurs et valeurs manquantes

Confrontée à l’imperfection des sources primaires, toute base de données contient des erreurs ou des lacunes. Ce segment fournit les techniques pour identifier et traiter les valeurs aberrantes (ex: un âge improbable dans un registre de recensement) et les données manquantes dans les archives administratives souvent incomplètes. Appliquer ces méthodes de “nettoyage” est une étape non-négociable pour garantir la validité des analyses ultérieures sur l’économie ou la démographie historique de la RDC.

II.4 Structuration des données : de l’archive papier à la matrice numérique

La transition de la donnée brute à la matrice exploitable est une opération critique. Ce sous-chapitre guide l’étudiant dans la transcription rigoureuse de sources papier (fiches d’inventaire, registres) vers un format tabulaire numérique (tableur). L’accent est mis sur la création d’un plan de codage et d’un dictionnaire de variables clairs, assurant que la base de données finale, par exemple sur les flux commerciaux du port de Matadi au XXe siècle, soit cohérente et prête pour l’analyse.

Chapitre III. Distributions de fréquences et représentations tabulaires

III.1 Tableaux de fréquences simples : effectifs, fréquences relatives et cumulées

L’organisation systématique des données commence par le dénombrement. Ce point expose comment construire et interpréter des tableaux de fréquences pour une variable. L’étudiant apprendra à calculer des effectifs (nombre brut de visiteurs d’une province au Musée National de la RDC), des fréquences relatives (le pourcentage que cela représente) et des fréquences cumulées (le pourcentage de visiteurs jusqu’à un certain seuil), offrant une première lecture synthétique et puissante de la distribution.

III.2 Regroupement en classes pour les variables quantitatives continues

Pour une lisibilité accrue des variables continues, le regroupement en classes est indispensable. Cette technique permet de synthétiser une longue série de données, comme les prix du cobalt sur plusieurs décennies, en intervalles (ou “classes”) pertinents. La section détaille les règles pour déterminer le nombre de classes et leur amplitude, une étape cruciale pour visualiser la structure sous-jacente de la distribution sans se perdre dans les détails superflus.

III.3 Tableaux de contingence et analyse bivariée

L’analyse croisée de deux variables qualitatives révèle des relations cachées. Le tableau de contingence (ou tableau croisé) est l’outil privilégié pour cela. Il permet de répondre à des questions comme : “Le niveau d’éducation (variable 1) est-il lié à la fréquentation des bibliothèques publiques (variable 2) à Kinshasa ?”. Ce sous-chapitre enseigne la construction, la lecture (en ligne, en colonne) et l’interprétation de ces tableaux pour mettre en évidence des dépendances ou des indépendances.

III.4 Mise en œuvre pratique avec un logiciel tableur

À l’ère du numérique, la maîtrise d’outils concrets est un impératif. Cette section est un tutoriel appliqué démontrant comment implémenter les techniques des trois points précédents à l’aide d’un tableur standard (type Excel, LibreOffice Calc). L’étudiant réalisera pas à pas la création de tableaux de fréquences et de tableaux croisés dynamiques à partir d’un jeu de données concret, comme la gestion des prêts de la bibliothèque de la faculté, ancrant ainsi la théorie dans une compétence technique directement monnayable.

PARTIE 2 : Analyse des Caractéristiques de Tendance Centrale et de Dispersion

Chapitre IV. Mesures de Tendance Centrale : Synthétiser les Données Historiques

IV.1 La moyenne arithmétique et ses applications

Fondement de toute synthèse quantitative, la moyenne arithmétique offre une valeur centrale résumant une série de données. Son calcul est un prérequis pour évaluer des performances ou des niveaux généraux. Cette section détaille sa méthodologie de calcul pour des données brutes et groupées, en insistant sur son interprétation. L’application portera sur le calcul du revenu moyen d’un planteur de café dans le Kivu sur une décennie, permettant de quantifier l’impact des fluctuations économiques sur les acteurs locaux.

IV.2 La médiane : une mesure robuste face aux extrêmes

Face à des distributions de données asymétriques, la médiane, valeur qui scinde la série en deux parties égales, s’avère plus représentative que la moyenne. Son insensibilité aux valeurs aberrantes en fait un outil crucial pour l’analyse socio-économique. Nous explorons ici sa détermination pour des séries discrètes et continues. L’utilité est démontrée par l’analyse des registres fonciers coloniaux, où la médiane révèle la taille typique d’une parcelle paysanne, non faussée par les immenses concessions.

IV.3 Le mode : identifier la valeur la plus fréquente

Une identification rapide de la valeur la plus fréquente, ou mode, fournit un aperçu direct des tendances dominantes au sein d’une population ou d’un corpus. Ce sous-chapitre se concentre sur la détection du mode dans les séries de données qualitatives et quantitatives discrètes. Son application pratique consistera à déterminer le type de document le plus consulté dans les archives nationales à Kinshasa, orientant ainsi les stratégies de numérisation et de conservation préventive.

IV.4 Choix et interprétation de l’indicateur de tendance centrale

Sous l’angle de la pertinence analytique, le choix de l’indicateur (moyenne, médiane, mode) n’est jamais neutre et dépend de la structure des données et de l’objectif de l’étude. Cette section établit une grille de décision rigoureuse pour sélectionner l’indicateur le plus juste. L’enjeu est illustré par l’évaluation de la fréquentation du Musée National de la RDC : la moyenne peut masquer une forte saisonnalité que la médiane ou le mode révéleraient, impactant la gestion des ressources humaines et logistiques.

Chapitre V. Mesures de Dispersion : Quantifier la Variabilité des Phénomènes Sociaux

V.1 L’étendue et l’écart interquartile

Au-delà du centre, la dispersion des données révèle leur hétérogénéité, une information capitale en sciences humaines. L’étendue et l’écart interquartile sont les premiers indicateurs de cette variabilité. Ce point technique expose leur calcul et leur capacité à identifier rapidement l’amplitude d’un phénomène et à isoler les 50% des observations les plus centrales. L’application portera sur la mesure de l’écart des prix des denrées alimentaires sur les marchés de Lubumbashi pour évaluer la stabilité économique locale.

V.2 La variance : mesure de la dispersion autour de la moyenne

Mesure fondamentale de la variabilité, la variance quantifie l’écart quadratique moyen des observations par rapport à leur moyenne. Une variance élevée signifie une grande hétérogénéité, et inversement. Ce sous-chapitre en détaille la formule et la signification profonde pour l’analyse historique. L’étudiant apprendra à calculer la variance des taux d’alphabétisation entre les différents territoires du Maniema au début du XXe siècle pour objectiver les disparités de développement induites par les politiques coloniales.

V.3 L’écart-type : un indicateur de dispersion interprétable

Pour une interprétation plus intuitive que la variance, l’écart-type, sa racine carrée, s’exprime dans la même unité que la variable étudiée. Il devient l’indicateur de dispersion le plus couramment utilisé pour qualifier la fiabilité d’une moyenne. La méthodologie de son calcul et son interprétation sont ici centrales. L’application consistera à analyser l’écart-type des dates d’acquisition des masques d’une collection muséale, informant sur les périodes de forte ou faible croissance des collections patrimoniales.

V.4 Le coefficient de variation pour la comparaison de séries

Comparer la dispersion de deux séries aux unités ou ordres de grandeur distincts (ex: salaires en CDF et taille des parcelles en hectares) est impossible avec l’écart-type seul. Le coefficient de variation, ratio de l’écart-type sur la moyenne, résout ce problème en fournissant une mesure relative de la dispersion. Ce module démontre son calcul et son pouvoir comparatif pour analyser la volatilité de la production de diamants (en carats) face à celle du cobalt (en tonnes) dans l’espace Kasaïen.

Chapitre VI. Représentations Graphiques : Visualiser l’Évolution et les Structures

VI.1 Histogrammes et diagrammes en bâtons

La traduction visuelle d’une distribution de fréquences par l’histogramme est une compétence essentielle pour l’analyste en sciences humaines. Ce sous-chapitre enseigne les règles de construction (choix du nombre de classes, amplitude) pour représenter la structure d’une population ou d’un phénomène. L’exercice pratique portera sur la construction de la pyramide des âges de la population de Goma à partir de données de recensement, permettant de visualiser instantanément les défis démographiques et générationnels locaux.

VI.2 Diagrammes circulaires et en secteurs

Pour illustrer la répartition d’un tout en ses parties constitutives, le diagramme circulaire est un outil de communication d’une efficacité redoutable. Cette section détaille sa construction et les conditions de sa pertinence, notamment pour les variables qualitatives nominales. L’étudiant apprendra à l’utiliser pour représenter la part des différentes sources de revenus (billetterie, mécénat, boutique) d’un site patrimonial comme le Parc National des Virunga, facilitant la prise de décision stratégique.

VI.3 Courbes d’évolution et séries temporelles

Une connaissance approfondie de l’évolution temporelle d’un phénomène est le cœur du métier d’historien et d’analyste. La courbe d’évolution (ou chronogramme) est l’outil par excellence pour visualiser les tendances, les cycles et les ruptures sur une période donnée. Ce module se focalise sur sa construction rigoureuse et son interprétation critique. L’application portera sur le traçage de la courbe de l’indice de production de cuivre en RDC depuis 1960 pour identifier les cycles de croissance et de récession.

VI.4 Nuages de points et exploration de la corrélation

L’exploration de la relation potentielle entre deux variables quantitatives débute par la construction d’un nuage de points. Cette représentation graphique permet de visualiser la forme, la direction et la force d’une éventuelle corrélation. Ce sous-chapitre guide l’étudiant dans la création et l’analyse de ces graphiques. L’objectif sera de mettre en corrélation le nombre de manuscrits conservés par une chefferie du Bas-Congo et le niveau d’investissement colonial dans cette entité pour formuler des hypothèses de recherche.

ANNEXES

A. Répertoire des sources de données historiques et culturelles en RDC

Face à la dispersion des archives, ce répertoire centralise les portails et institutions clés pour la collecte de données quantitatives en RDC. Il recense les bases de données de l’Institut National de la Statistique (INS), les archives coloniales numérisées, les registres des missions religieuses et les rapports d’organisations internationales. L’objectif est de fournir à l’étudiant un accès direct aux sources primaires pour analyser l’évolution démographique de Kinshasa, les flux commerciaux historiques du Katanga ou la production agricole du Kivu.

B. Formulaire statistique et glossaire terminologique

Pour une application rigoureuse des concepts, ce vade-mecum synthétise l’ensemble des formules mathématiques de la statistique descriptive (moyenne, médiane, variance, écart-type, quartiles) et clarifie le vocabulaire technique (population, échantillon, variable, fréquence). Il est conçu comme un outil de référence rapide, permettant à l’analyste de valider ses calculs et d’employer une terminologie précise et normalisée dans ses rapports, garantissant ainsi la crédibilité scientifique de ses analyses sur le patrimoine congolais.

C. Guide pratique des outils logiciels pour l’analyse de données

Une maîtrise des outils numériques conditionne l’employabilité de l’analyste. Ce guide présente une prise en main accélérée de tableurs (Excel, LibreOffice Calc) pour le traitement de base et d’environnements plus puissants comme le logiciel R avec RStudio. Il détaille les commandes essentielles pour l’importation de données, le calcul des indicateurs de tendance centrale et de dispersion, ainsi que la génération de graphiques (histogrammes, diagrammes en boîte), appliqués à des données de fréquentation muséale.

D. Modèle de rapport d’analyse quantitative : Étude de cas sur la fréquentation du Musée National de la RDC (MNRDC)

La structuration d’un rapport d’analyse est une compétence fondamentale. Cet annexe propose un canevas complet, de l’introduction problématisée à la conclusion opérationnelle, en passant par la méthodologie de collecte et l’interprétation des graphiques. En simulant une analyse de la saisonnalité des visites au MNRDC, il démontre comment transformer des données brutes en recommandations stratégiques pour la direction du musée, par exemple pour optimiser les campagnes de communication ou ajuster les grilles tarifaires.

Discussion (0)

Aucune intervention pour le moment. Soyez le premier à contribuer.

Statistique Descriptive : Cours pour Sciences Humaines et Sociales en RDC