Étudiant analysant des graphiques de statistiques sociales sur un ordinateur.

Statistiques appliquées

Utilisation de modèles quantitatifs pour traiter les données démographiques humaines.

Édition 2026 – Réforme LMD – Enseignement supérieur et universitaire en RDC.

Code Officiel : IAS1121
Domaine : Sciences de l'Homme et de la Société
Filière : Anthropologie
Mention : Anthropologie médicale, du genre et du développement
Année d’étude : LICENCE 1
Semestre : Semestre 2

Consulter les Modalités, Compétences et Débouchés

Cette Unité d’Enseignement, valorisée à hauteur de 2 crédits ECTS, s’articule autour d’un unique Élément Constitutif intitulé Statistiques appliquées à la science de l’homme. Son volume horaire, volontairement non figé, est conçu pour s’adapter avec flexibilité aux profils des apprenants et aux impératifs pédagogiques du cursus, garantissant ainsi une couverture exhaustive des notions fondamentales tout en permettant un approfondissement par projets ou études de cas.

Le diplôme attendu, bien que non spécifié ici car cette UE peut s’intégrer à divers parcours, conférera une double compétence de haute valeur. Il sanctionnera non seulement une expertise dans un domaine des sciences humaines, mais aussi et surtout une maîtrise rigoureuse des méthodologies quantitatives. Cette hybridation positionne le diplômé comme un profil rare et précieux, capable de fonder ses analyses sociales, démographiques ou économiques sur des données probantes et objectivement mesurées.

L’acquisition des compétences visées transforme l’étudiant en un véritable architecte de la donnée sociale. Il apprendra à traiter des données quantitatives brutes pour les rendre intelligibles, puis à interpréter les indicateurs statistiques pour révéler les logiques profondes qui structurent les faits humains. Enfin, sa capacité à réaliser une présentation visuelle pertinente de ses résultats lui permettra de traduire des analyses complexes en outils d’aide à la décision clairs, percutants et immédiatement opérationnels.

Les métiers cibles, tels qu’assistant statisticien en sciences sociales ou analyste de données sociodémographiques, répondent à un besoin critique sur le marché de l’emploi en République Démocratique du Congo. Dans un contexte de reconstruction et de développement, ces professionnels sont indispensables aux administrations publiques, aux ONG et aux instituts de recherche pour piloter les politiques publiques, évaluer l’impact des programmes de développement et optimiser l’allocation des ressources. Ils constituent le socle d’une planification éclairée et factuelle, essentielle à l’avenir du pays.

PRÉLIMINAIRES

I. Positionnement de l’Unité d’Enseignement

Essentielle à la formation de l’anthropologue moderne, cette UE dote l’étudiant des outils quantitatifs indispensables à l’objectivation des faits sociaux. Elle constitue le socle méthodologique permettant de passer de l’observation qualitative à la modélisation statistique des phénomènes humains. L’objectif est de transformer les données démographiques, sanitaires et sociales brutes collectées en RDC en indicateurs fiables, aptes à éclairer la décision et l’action au sein des ONG, des institutions publiques et des bureaux d’études.

II. Compétences visées et débouchés professionnels

Au terme de ce cours, l’étudiant maîtrisera le traitement de données quantitatives, l’interprétation critique des indicateurs statistiques et leur communication visuelle efficace. Ces compétences ouvrent directement l’accès aux métiers d’assistant statisticien en sciences sociales, d’analyste de données pour les programmes de développement, ou de chargé de traitement de bases de données pour les enquêtes sociodémographiques, des profils activement recherchés pour l’évaluation de projets en RDC.

III. Méthodologie et évaluation

L’approche pédagogique combine exposés théoriques magistraux et ateliers pratiques sur des jeux de données réels issus du contexte congolais (enquêtes démographiques et de santé, données de projets de développement). L’évaluation est duale : un examen final écrit vérifiant la maîtrise conceptuelle (50%) et un projet pratique de traitement et d’analyse d’une base de données (50%), sanctionnant la capacité de l’étudiant à produire un rapport statistique rigoureux et interprétable.

IV. Prérequis et environnement de travail

Une maîtrise des mathématiques de base (arithmétique, pourcentages) est requise. L’étudiant devra se familiariser avec un logiciel de traitement de données (tel que SPSS, ou à défaut, les fonctionnalités avancées d’Excel). L’accès à des ressources informatiques est donc une condition nécessaire pour la réalisation des travaux pratiques, qui simulent les conditions professionnelles d’un analyste de données en sciences sociales.

PARTIE 1 : FONDEMENTS DE LA STATISTIQUE DESCRIPTIVE EN SCIENCES HUMAINES

Chapitre I. Nature et Structuration des Données Anthropologiques

I.1 Distinction des variables et typologie

Fondement de toute analyse quantitative, la distinction entre variables qualitatives (nominales, ordinales) et quantitatives (discrètes, continues) structure la démarche statistique. Ce sous-chapitre outille l’étudiant pour identifier correctement la nature de chaque information collectée lors d’une enquête de terrain en RDC. Cette taxonomie rigoureuse est la condition sine qua non pour choisir les outils d’analyse et de visualisation appropriés, évitant ainsi des erreurs d’interprétation grossières sur des faits sociaux complexes.

I.2 Rigueur classificatoire des échelles de mesure

Sous l’angle de la rigueur classificatoire, les échelles de mesure (nominale, ordinale, d’intervalle, de rapport) définissent le niveau de précision d’une donnée. Leur maîtrise permet de déterminer les opérations mathématiques admissibles et la pertinence des indicateurs à calculer. Nous appliquons cette connaissance à la structuration de questionnaires sur la perception du genre ou l’accès aux soins dans les provinces de la RDC, garantissant la validité scientifique des données collectées en amont de toute analyse.

I.3 Conception d’outils de collecte et représentativité

Face aux défis logistiques du terrain congolais, la conception d’un bon outil de collecte (questionnaire, grille d’observation) est cruciale. Ce point aborde les techniques d’échantillonnage (aléatoire, stratifié, par grappes) pour assurer la représentativité d’une population cible, qu’il s’agisse des déplacés du Nord-Kivu ou des artisans de Kinshasa. L’objectif est de construire un échantillon dont les résultats pourront être généralisés à l’ensemble de la population étudiée avec un degré de confiance mesurable.

I.4 Transcription des données : codage et matrice

Une transcription rigoureuse des données brutes en une matrice numérique est l’étape charnière entre la collecte et l’analyse. Ce sous-chapitre enseigne les techniques de codage des variables qualitatives et la construction d’un dictionnaire de variables (“codebook”). Cette discipline garantit l’intégrité, la traçabilité et la pérennité des bases de données, une compétence essentielle pour travailler au sein d’institutions comme l’Institut National de la Statistique (INS) ou les agences des Nations Unies en RDC.

Chapitre II. Analyse des Tendances Centrales et de Position

II.1 Pertinence du mode et de la médiane

Pour des données qualitatives ou des distributions asymétriques, le mode et la médiane sont des indicateurs de tendance centrale plus robustes que la moyenne. Le mode identifie la catégorie la plus fréquente (ex: l’ethnie majoritaire dans un village), tandis que la médiane segmente la population en deux moitiés égales (ex: le revenu médian). Leur calcul et leur interprétation sont démontrés sur des données socio-économiques congolaises pour dresser un portrait nuancé des réalités sociales.

II.2 Calcul et interprétation de la moyenne arithmétique

Calculée comme la somme des valeurs divisée par l’effectif, la moyenne arithmétique est l’indicateur de tendance centrale le plus commun mais aussi le plus sensible aux valeurs extrêmes. Ce sous-chapitre expose sa méthode de calcul pour les données brutes et groupées, et insiste sur l’analyse critique de sa pertinence. Son application est illustrée par le calcul de l’âge moyen au premier mariage ou du nombre moyen d’enfants par femme en RDC, en soulignant les biais potentiels.

II.3 Usages spécifiques des moyennes géométrique et harmonique

Au-delà de la moyenne arithmétique, les moyennes géométrique et harmonique offrent des perspectives analytiques spécifiques. La première est indispensable pour calculer des taux de croissance moyens (ex: croissance démographique annuelle d’une ville comme Goma). La seconde s’applique aux grandeurs inverses comme les vitesses ou les densités. Leur maîtrise permet à l’analyste de modéliser avec précision des phénomènes dynamiques, un atout pour les études de développement et de prospective en RDC.

II.4 Positionnement par les quantiles : quartiles, déciles, centiles

Une analyse fine de la répartition des richesses ou des niveaux d’éducation en RDC exige de segmenter la population. Les quantiles (quartiles, déciles, centiles) sont les outils de positionnement par excellence pour cela. Ce point technique montre comment les calculer et les interpréter pour identifier les seuils qui séparent les 25% les plus pauvres, les 10% les plus riches, etc. C’est une compétence clé pour produire des rapports sur les inégalités sociales à destination des décideurs politiques.

Chapitre III. Mesures de Dispersion et de Forme

III.1 Saisie de l’hétérogénéité par l’étendue et l’écart interquartile

Saisir la volatilité d’un phénomène est aussi important que de connaître sa tendance centrale. L’étendue et l’écart interquartile sont deux mesures simples de la dispersion. L’étendue (max-min) est sensible aux extrêmes, tandis que l’écart interquartile mesure la dispersion des 50% centraux de la distribution, offrant une vision plus stable de l’hétérogénéité. Leur application permet de quantifier, par exemple, l’inégalité des salaires au sein d’une entreprise minière du Katanga.

III.2 Fondements de la variance et de l’écart-type

Fondement de l’analyse de la dispersion, la variance mesure l’écart quadratique moyen des observations par rapport à la moyenne. L’écart-type, sa racine carrée, exprime cette dispersion dans l’unité de mesure originale, le rendant plus intuitif. Ce sous-chapitre détaille leur calcul et leur signification profonde : un faible écart-type indique une forte homogénéité (ex: âge des élèves d’une classe), un écart-type élevé une forte hétérogénéité (ex: revenus dans un quartier de Kinshasa).

III.3 Comparaison de la dispersion : le coefficient de variation

Afin de comparer la dispersion relative de deux séries de données n’ayant pas la même unité ou le même ordre de grandeur, le coefficient de variation est l’outil adéquat. Défini comme le rapport de l’écart-type à la moyenne, il est un indicateur sans dimension. Cette section montre comment l’utiliser pour déterminer si la variation des prix des denrées alimentaires est plus forte à Lubumbashi qu’à Matadi, indépendamment des niveaux de prix moyens respectifs.

III.4 Caractérisation par l’asymétrie (skewness) et l’aplatissement (kurtosis)

L’étude de la forme d’une distribution révèle des informations cruciales. Le coefficient d’asymétrie (skewness) indique si la distribution est étalée vers la droite (valeurs élevées) ou la gauche (valeurs faibles). Le coefficient d’aplatissement (kurtosis) mesure la concentration des valeurs autour de la moyenne. Ces deux indicateurs sont essentiels pour modéliser la pyramide des âges congolaise ou la distribution des revenus, et pour valider les hypothèses de normalité requises par les tests statistiques avancés.

PARTIE 2 : Modélisation Statistique des Faits Sociaux

Chapitre V. Les Indicateurs de Tendance Centrale

V.1 La moyenne arithmétique et ses applications

Fondement de l’analyse descriptive, la moyenne arithmétique synthétise une série de données quantitatives en une valeur unique représentative de son centre de gravité. Ce sous-chapitre expose sa méthode de calcul et sa sensibilité aux valeurs extrêmes. L’étudiant apprendra à l’utiliser pour calculer l’âge moyen de la première grossesse dans une zone de santé du Kasaï ou le nombre moyen d’années de scolarisation dans une communauté, fournissant un premier indicateur synthétique pour l’analyse de politiques publiques.

V.2 La médiane comme indicateur robuste

Face à la présence de valeurs extrêmes qui faussent la moyenne, la médiane offre une alternative robuste en identifiant la valeur qui scinde la population en deux moitiés égales. Sa détermination et son interprétation sont ici détaillées. Cette compétence est cruciale pour l’anthropologue qui doit déterminer le revenu médian d’un quartier de Kinshasa, plus représentatif que la moyenne face aux fortes inégalités, ou l’âge médian au mariage dans une société pour éviter la distorsion statistique.

V.3 Le mode et l’identification des pics de fréquence

Une compréhension fine des phénomènes modaux révèle la catégorie ou la valeur la plus fréquente au sein d’un échantillon. Ce point aborde l’identification du mode pour les variables nominales, ordinales et quantitatives discrètes. L’application pratique consiste à identifier la source d’eau potable la plus utilisée dans les villages du Maniema pour orienter les interventions sanitaires, ou la pathologie la plus fréquemment diagnostiquée dans un centre de santé pour optimiser l’approvisionnement en médicaments.

V.4 Le choix raisonné de l’indicateur central

Sous l’angle de la pertinence analytique, le choix entre moyenne, médiane et mode n’est pas neutre ; il dépend de la nature de la variable et de la forme de sa distribution. Cette section outille l’étudiant pour justifier méthodologiquement sa décision. Il s’agit de démontrer, par exemple, pourquoi la médiane est préférable à la moyenne pour analyser la répartition des parcelles agricoles en Ituri (souvent asymétrique) afin de produire une analyse socio-économique rigoureuse et non biaisée.

Chapitre VI. Les Indicateurs de Dispersion et de Position

VI.1 L’étendue et l’écart interquartile

Au-delà du centre d’une distribution, sa dispersion est mesurée initialement par l’étendue et l’écart interquartile, qui quantifient l’étalement des données. Ce sous-chapitre enseigne le calcul et l’interprétation de ces indicateurs simples mais puissants. L’étudiant pourra ainsi évaluer l’hétérogénéité des taux de scolarisation entre les écoles d’une même sous-division éducationnelle en RDC ou la variabilité des prix d’un produit de base sur différents marchés de Matadi, identifiant les zones de fortes disparités.

VI.2 La variance et l’écart-type

Pour une quantification plus rigoureuse de la volatilité autour de la moyenne, la variance et sa racine carrée, l’écart-type, sont indispensables. Leur formalisme mathématique et leur signification concrète sont ici explicités. Cette maîtrise permet de mesurer la variabilité des dépenses de santé par ménage à Lubumbashi ou l’instabilité des rendements agricoles d’une saison à l’autre dans la province du Kwilu, fournissant des données clés pour l’analyse de la vulnérabilité des populations.

VI.3 Le coefficient de variation

Comparer la dispersion de deux séries aux unités ou moyennes distinctes impose l’utilisation d’une mesure relative : le coefficient de variation. Ce point technique démontre comment standardiser la mesure de la dispersion pour effectuer des comparaisons valides. L’analyste pourra ainsi comparer la dispersion relative du poids des nouveau-nés entre Goma et Bukavu, ou évaluer si les revenus des pêcheurs du lac Tanganyika sont plus ou moins volatiles que ceux des agriculteurs du Bas-Uele.

VI.4 Les quantiles : quartiles, déciles et centiles

Positionner un individu ou une observation au sein d’un collectif est la fonction cardinale des quantiles, qui segmentent une distribution ordonnée en parties égales. Ce sous-chapitre couvre leur calcul et leur application pour stratifier une population. L’étudiant apprendra à utiliser les déciles pour classer les ménages selon leur niveau de consommation afin de cibler les programmes d’aide alimentaire, ou les quartiles pour définir les seuils de malnutrition infantile dans une enquête nutritionnelle.

Chapitre VII. Représentations Graphiques et Heuristique Visuelle

VII.1 Histogrammes et diagrammes en bâtons

Traduire les distributions de fréquences en une image intelligible est le rôle de l’histogramme pour les variables continues et du diagramme en bâtons pour les discrètes. Cette section détaille les règles de construction pour produire des graphiques clairs et non trompeurs. L’application directe est de visualiser la pyramide des âges d’un camp de réfugiés près de la frontière ougandaise pour anticiper les besoins en services, ou de représenter la répartition des ethnies dans une enquête de terrain.

VII.2 Diagrammes en boîte à moustaches (Box Plots)

Synthèse visuelle puissante, le diagramme en boîte à moustaches encapsule en une seule figure la tendance centrale (médiane), la dispersion (écart interquartile) et la présence de valeurs aberrantes. Sa construction et son interprétation sont au cœur de ce point. L’étudiant pourra comparer l’efficacité de plusieurs centres de traitement du choléra via la distribution des durées d’hospitalisation ou analyser les disparités de salaires entre hommes et femmes dans le secteur minier du Lualaba.

VII.3 Courbe de Lorenz et indice de Gini

Quantifier et visualiser les inégalités de répartition d’une ressource est un enjeu majeur pour l’anthropologie du développement. La courbe de Lorenz et l’indice de Gini qui en dérive offrent un outil standardisé pour cet objectif. Ce sous-chapitre guide l’étudiant dans leur élaboration et leur interprétation. Il s’agira de modéliser la concentration de la production de cacao entre les planteurs d’une coopérative du Nord-Kivu pour évaluer l’équité de la chaîne de valeur.

VII.4 Nuages de points et exploration bivariée

Sous l’angle de l’analyse bivariée, le nuage de points est l’outil exploratoire premier pour déceler visuellement une possible relation (linéaire ou non) entre deux variables quantitatives. La méthodologie de sa création et les premiers niveaux d’interprétation sont présentés ici. L’étudiant apprendra à examiner la corrélation potentielle entre le niveau d’accès à l’électricité et le taux d’alphabétisation des femmes dans les territoires du Kwango, posant les bases d’une future modélisation par régression.

ANNEXES

A. Glossaire technique et conceptuel

Une maîtrise rigoureuse du vocabulaire statistique est le prérequis à toute analyse scientifique. Ce glossaire définit avec une précision chirurgicale les concepts fondamentaux (variable, échantillon, population, p-valeur, intervalle de confiance) et les termes techniques mobilisés dans l’UE. Son objectif est de forger un langage commun et d’éviter les contresens interprétatifs, particulièrement lors de la lecture de rapports produits par des organismes nationaux (INS-RDC) ou internationaux (PNUD, FNUAP) opérant sur le territoire congolais.

B. Guide d’initiation pratique au logiciel R

Face à la nécessité de traiter des volumes de données croissants, l’utilisation d’un logiciel spécialisé est incontournable. Cet aide-mémoire constitue un guide de mise en main rapide du logiciel R, standard open-source de l’analyse statistique. Il détaille, commandes à l’appui, les étapes cruciales : importation d’un fichier de données (type Excel), calcul des indicateurs de tendance centrale et de dispersion, et génération des graphiques de base pour visualiser une distribution démographique.

C. Répertoire des sources de données sociodémographiques pour la RDC

L’accès à des données fiables constitue le socle de toute analyse pertinente du contexte congolais. Ce répertoire recense et décrit les principales bases de données publiques et enquêtes de référence pour la RDC. Il inclut les portails de l’Institut National de la Statistique (INS-RDC), les enquêtes démographiques et de santé (EDS-RDC), les enquêtes par grappes à indicateurs multiples (MICS), ainsi que les bases de données de la Banque Mondiale, de l’OMS et du FNUAP.

D. Protocole de conception d’un questionnaire quantitatif

De la pertinence des questions posées dépend la validité des résultats statistiques. Ce protocole méthodologique guide l’étudiant dans l’élaboration d’un instrument de collecte de données quantitatives adapté aux réalités du terrain en RDC. Il couvre la formulation d’hypothèses, l’opérationnalisation des variables, le choix des échelles de mesure (Likert, nominale) et les techniques de pré-test du questionnaire pour garantir la fiabilité des données collectées dans les zones de santé ou les communes urbaines.

Discussion (0)

Aucune intervention pour le moment. Soyez le premier à contribuer.

Statistiques Appliquées en Sciences Sociales | Formation Universitaire RDC