
Statistique 1
Utilisation de la statistique descriptive pour traiter les données sociales.
Édition 2026 – Réforme LMD – Enseignement supérieur et universitaire en RDC.
- Code Officiel : STA1111
- Domaine : Sciences de l'Homme et de la Société
- Filière : Sciences du Travail
- Mention : Sciences du Travail
- Année d’étude : LICENCE 1
- Semestre : Semestre 1
Consulter les Modalités, Compétences et Débouchés
Cette Unité d’Enseignement, valorisée à hauteur de 4 crédits ECTS, est entièrement structurée autour d’un unique Élément Constitutif : la Statistique descriptive. Bien que le volume horaire précis soit à définir en fonction du contexte pédagogique, cette architecture monodisciplinaire garantit une immersion complète et approfondie dans les fondamentaux de l’analyse de données, constituant ainsi un bloc de compétences cohérent et indivisible.
L’absence de spécification d’un diplôme unique souligne la nature intrinsèquement transversale de cette Unité d’Enseignement. Conçue pour s’intégrer de manière flexible à divers parcours académiques, des sciences de gestion aux sciences sociales, sa véritable valeur ajoutée ne réside pas dans une certification finale prédéfinie, mais dans l’acquisition d’un socle de compétences transversales techniques immédiatement monnayable sur le marché du travail, quel que soit le diplôme visé.
Au-delà de la simple manipulation de chiffres, les compétences visées transforment l’apprenant en un acteur stratégique. Il apprendra à transformer un volume de données brutes, souvent complexes et désorganisées, en une synthèse structurée. En maîtrisant le calcul et l’interprétation d’indicateurs clés comme la moyenne, la médiane ou l’écart-type, il sera capable de diagnostiquer une situation et de la communiquer efficacement. La finalité est de produire des visualisations graphiques percutantes, non pas comme de simples illustrations, mais comme de véritables outils d’aide à la prise de décision managériale, éclairant les choix stratégiques de l’organisation.
Cette formation prépare directement à des métiers essentiels tels qu’Assistant en statistiques RH, Gestionnaire de bases de données sociales ou Technicien de traitement de données. En République Démocratique du Congo, ces profils sont d’une importance capitale. Ils sont les artisans de la transformation numérique, permettant aux entreprises et aux organisations de piloter leur performance, d’optimiser la gestion des ressources humaines et de mesurer l’impact des projets sociaux. Dans un contexte de développement économique et de reconstruction, la capacité à analyser rigoureusement les données est un levier stratégique pour la croissance, la transparence et l’efficacité des politiques publiques et privées.
PRÉLIMINAIRES
I. Justification de l’Unité d’Enseignement
La transformation structurelle de l’économie congolaise et la modernisation de ses organisations exigent une gestion du capital humain fondée sur des évidences quantifiables. Cette UE dote le futur professionnel des sciences du travail des outils statistiques descriptifs indispensables pour objectiver les diagnostics sociaux, mesurer la performance RH et piloter le changement. Elle constitue le socle méthodologique pour passer d’une gestion administrative du personnel à un management stratégique des ressources humaines, aligné sur les impératifs de productivité et d’équité.
II. Compétences Visées et Débouchés en RDC
Au terme de ce cours, l’étudiant sera capable de transformer un amas de données sociales brutes en un rapport synthétique et intelligible pour la prise de décision. Cette compétence est directement monétisable sur le marché du travail congolais pour des postes d’Assistant en statistiques RH au sein des départements RH des entreprises minières ou brassicoles, de Gestionnaire de bases de données sociales pour les ONG internationales et les agences onusiennes, ou de Technicien de traitement de données pour les cabinets de conseil et les instituts de sondage à Kinshasa ou Lubumbashi.
III. Méthodologie d’Apprentissage et d’Évaluation
L’approche pédagogique privilégie une articulation constante entre la rigueur théorique et la pertinence pratique. Chaque concept sera illustré par des études de cas tirées du contexte socio-économique de la RDC (ex: analyse de la pyramide des âges d’une entreprise publique, enquête sur la satisfaction des employés dans le secteur bancaire). L’évaluation combinera un examen final validant la maîtrise conceptuelle et un projet pratique de traitement d’un jeu de données réel, simulant une mission professionnelle concrète.
IV. Articulation avec le Projet Professionnel de l’Étudiant
Cette unité d’enseignement fondamentale positionne l’étudiant comme un futur acteur clé de la modernisation des pratiques managériales en RDC. La maîtrise de la statistique descriptive est le prérequis technique pour évoluer vers des fonctions d’analyse plus complexes (statistique inférentielle, modélisation prédictive) et des postes à plus haute responsabilité comme Chargé d’études RH, Contrôleur de gestion sociale ou Consultant en organisation, capables de dialoguer avec les directions générales sur la base de faits chiffrés.
PARTIE 1 : FONDEMENTS ET STRUCTURATION DES DONNÉES SOCIALES
Chapitre I. Introduction à la Statistique Descriptive en Sciences du Travail
I.1 Définition et Rôle de la Statistique
Discipline du quantitatif, la statistique descriptive fournit les méthodes pour résumer et synthétiser l’information contenue dans les données. Pour le manager en sciences du travail en RDC, elle est l’instrument qui permet de quantifier les phénomènes sociaux au sein de l’entreprise (absentéisme, turnover, climat social) afin de les comprendre, de les maîtriser et d’en rendre compte de manière objective. Sa maîtrise est une condition de crédibilité managériale.
I.2 Concepts Fondamentaux : Population, Échantillon, Variable, Modalité
Face à la complexité des effectifs d’une grande entreprise ou d’un secteur, la statistique opère avec un vocabulaire précis. Ce point définit rigoureusement la population (ex: tous les employés de la GÉCAMINES), l’échantillon (un sous-groupe représentatif), la variable (le critère étudié, ex: l’ancienneté) et la modalité (la valeur que prend la variable, ex: “10 ans”). La distinction correcte de ces concepts est le préalable à toute analyse valide.
I.3 Typologie des Variables : Qualitatives et Quantitatives
Sous l’angle de la mesure, toutes les données ne sont pas égales. Ce sous-chapitre établit la distinction cardinale entre les variables qualitatives (nominales, ordinales) qui catégorisent (ex: statut marital, niveau de satisfaction) et les variables quantitatives (discrètes, continues) qui mesurent (ex: nombre d’enfants, salaire mensuel). Cette taxonomie est décisive car elle conditionne le choix des indicateurs et des graphiques pertinents pour l’analyse.
I.4 Éthique et Responsabilité dans la Manipulation des Données Sociales en RDC
Une conscience aiguë des enjeux éthiques doit encadrer toute collecte de données nominatives. Ce point aborde les principes de consentement éclairé, d’anonymat et de confidentialité, cruciaux lors du traitement de données sensibles (appartenance syndicale, état de santé) dans le contexte légal et culturel congolais. Il s’agit de former des praticiens non seulement compétents techniquement, mais aussi responsables et respectueux de la dignité des travailleurs.
Chapitre II. Techniques de Collecte des Données en Milieu Professionnel Congolais
II.1 Conception et Administration de Questionnaires d’Enquête
Élaborer un questionnaire pertinent est un art qui prévient les biais en amont. Cette section détaille la formulation de questions claires et univoques, le choix des échelles de réponse (Likert, etc.) et les stratégies d’administration adaptées au terrain congolais : prise en compte du niveau d’alphabétisation, traduction en langues nationales, et création d’un climat de confiance pour garantir la sincérité des réponses sur des sujets comme la rémunération ou les conditions de travail.
II.2 Méthodes d’Échantillonnage : Aléatoire, Stratifié, par Grappes
Le choix d’une méthode d’échantillonnage rigoureuse garantit la représentativité des résultats et la possibilité de généraliser les conclusions. Nous analysons ici l’applicabilité des différentes techniques en RDC : l’échantillonnage stratifié pour assurer la représentation des différentes catégories de personnel (ouvriers, cadres), ou l’échantillonnage par grappes pour enquêter sur des sites d’exploitation minière géographiquement dispersés dans le Katanga.
II.3 L’Observation Directe et l’Entretien Structuré
Au-delà du questionnaire, l’observation directe (ex: analyse des postes de travail pour une étude ergonomique) et l’entretien structuré (ex: comprendre les causes profondes du turnover) fournissent des données riches. Ce sous-chapitre enseigne comment systématiser ces approches pour les rendre statistiquement exploitables, en créant des grilles d’observation et des guides d’entretien standardisés, assurant ainsi la comparabilité des informations collectées.
II.4 Fiabilisation des Données : Gestion des Non-Réponses et des Biais de Collecte
Face au défi des données manquantes ou erronées, un praticien doit savoir réagir. Cette partie expose les techniques de détection et de traitement des non-réponses, qui peuvent fausser lourdement une analyse de climat social. Elle sensibilise aux biais de sélection (ex: n’interroger que les employés présents au bureau) et de désirabilité sociale, en fournissant des stratégies pour les minimiser et garantir la robustesse des données collectées sur le terrain.
Chapitre III. Organisation et Présentation Synthétique des Données Brutes
III.1 Dépouillement, Codification et Création d’une Matrice de Données
Une fois les données collectées, la phase de dépouillement les transforme en un format analysable. Ce processus implique la codification des réponses textuelles en valeurs numériques (ex: “Homme”=1, “Femme”=2) et leur saisie dans une matrice de données (type tableur), où les lignes représentent les individus et les colonnes les variables. La rigueur de cette étape est fondamentale pour éviter les erreurs qui se propageraient dans toute l’analyse ultérieure.
III.2 Tableaux Statistiques à une Variable : Distributions de Fréquences
La construction de tableaux de fréquences est le premier acte de synthèse statistique. Ce sous-chapitre montre comment organiser les données d’une variable pour calculer les fréquences absolues (effectifs), relatives (pourcentages) et cumulées. Un tel tableau permet de visualiser instantanément la répartition des effectifs d’une entreprise par tranche d’âge ou par niveau d’étude, fournissant un premier diagnostic essentiel pour la gestion des carrières.
III.3 Séries Statistiques à Deux Variables : Tableaux de Contingence
Pour analyser la relation entre deux variables qualitatives, le tableau de contingence est l’outil de choix. Il permet de croiser deux critères, comme le “département de l’entreprise” et le “motif d’absence”, pour identifier des corrélations. Un manager RH peut ainsi détecter si un taux d’absentéisme pour maladie est anormalement élevé dans un service spécifique, déclenchant une action ciblée sur les conditions de travail.
III.4 Principes de Nettoyage des Données (Data Cleaning)
La qualité de l’analyse dépendant de la propreté des données, le nettoyage est une étape non négociable. Cette section présente les méthodes pour détecter et corriger les erreurs de saisie, les incohérences (ex: un employé avec 5 ans d’ancienneté et âgé de 20 ans) et les valeurs aberrantes qui pourraient fausser les calculs de moyennes. Maîtriser ces techniques assure la fiabilité du diagnostic social et la crédibilité des recommandations managériales.
PARTIE 2 : ANALYSE UNIVARIÉE DES DONNÉES SOCIALES
Chapitre IV. Les Indicateurs de Tendance Centrale
IV.1 La moyenne arithmétique
Calcul synthétique par excellence, la moyenne arithmétique établit la valeur centrale d’une série de données quantitatives en sommant les observations et en les divisant par leur nombre. Son application dans l’analyse des salaires moyens dans le secteur minier du Katanga ou du temps de travail hebdomadaire à Kinshasa fournit un premier repère décisionnel pour les gestionnaires RH et les décideurs politiques. Sa maîtrise est une condition sine qua non pour toute analyse statistique ultérieure.
IV.2 La médiane
Face à la présence de valeurs extrêmes qui peuvent fausser la moyenne, la médiane offre une mesure de tendance centrale plus robuste. En tant que valeur qui divise une série ordonnée en deux parties égales, elle représente le véritable “milieu” de la population. Son calcul est essentiel pour évaluer le revenu “typique” d’un ménage dans les communes de Kinshasa, en neutralisant l’effet des très hauts revenus, et ainsi orienter plus finement les politiques sociales d’aide.
IV.3 Le mode
Pour les données qualitatives ou nominales où le calcul de la moyenne ou de la médiane est impossible, le mode identifie la catégorie la plus fréquente. Son identification permet au gestionnaire des ressources humaines de déterminer la cause principale d’accidents de travail, le motif de démission le plus courant, ou la compétence la plus demandée dans les offres d’emploi en RDC. C’est un indicateur direct et pragmatique pour l’action corrective et la planification stratégique des talents.
IV.4 Choix et interprétation des indicateurs
Une analyse rigoureuse impose un choix judicieux entre moyenne, médiane et mode, dicté par la nature des données et l’objectif de l’étude. Ce sous-chapitre outille l’étudiant pour argumenter le choix de l’indicateur le plus pertinent : évaluer la performance d’une équipe de vente (moyenne), analyser la répartition des âges dans une administration publique (médiane), ou comprendre les préférences des consommateurs sur le marché de la téléphonie mobile en RDC (mode).
Chapitre V. Les Indicateurs de Dispersion
V.1 L’étendue et l’intervalle interquartile
Au-delà de la tendance centrale, l’étude de la dispersion révèle l’homogénéité ou l’hétérogénéité d’un groupe. Le calcul de l’étendue des salaires dans une PME de Goma peut signaler des inégalités flagrantes, tandis que l’intervalle interquartile, moins sensible aux extrêmes, permet de focaliser l’analyse sur la dispersion des 50% centraux des employés. Cette dernière mesure offre une base plus stable pour les comparaisons inter-départementales et le pilotage RH.
V.2 La variance
Mesure fondamentale de la variabilité, la variance quantifie l’écart quadratique moyen des observations par rapport à leur moyenne. Bien que son unité (ex: “francs congolais au carré”) soit peu intuitive pour une interprétation directe, sa maîtrise conceptuelle et calculatoire est un prérequis pour des analyses plus complexes comme l’analyse de la variance (ANOVA). Elle est utilisée pour évaluer la consistance de la production journalière dans une usine de transformation agroalimentaire du Kongo Central.
V.3 L’écart-type
Traduction directe et interprétable de la variance, l’écart-type est l’indicateur de dispersion le plus utilisé en gestion. Exprimé dans la même unité que la variable, il permet de communiquer clairement sur la volatilité des ventes, l’hétérogénéité des notes de performance des employés ou le risque associé à un portefeuille d’investissements locaux. Un faible écart-type des temps de trajet à Kinshasa signifierait, par exemple, un réseau de transport public fiable et prédictible.
V.4 Le coefficient de variation
Face au défi de comparer la dispersion de séries aux unités ou ordres de grandeur différents, le coefficient de variation s’impose comme l’outil de normalisation. En rapportant l’écart-type à la moyenne, il crée un ratio sans dimension. Il permet de déterminer si la dispersion des salaires (en CDF) est plus grande que celle de l’ancienneté (en années) au sein de la fonction publique, ou de comparer la volatilité des prix du cuivre à celle du cobalt.
Chapitre VI. Les Indicateurs de Position et de Forme
VI.1 Les quantiles : quartiles, déciles, centiles
Segmenter une population ordonnée en sous-groupes de taille égale est une technique puissante pour le positionnement et la classification. Les quartiles sont utilisés pour définir les grilles salariales, les déciles pour analyser les inégalités de revenus (rapport D9/D1) au sein de la société congolaise, et les centiles pour situer un individu (ex: un enfant par rapport aux courbes de croissance de l’OMS en RDC) ou une entreprise par rapport à un standard de performance sectoriel.
VI.2 La représentation par boîte à moustaches (Box Plot)
Synthèse visuelle et dense, la boîte à moustaches permet de visualiser d’un seul coup d’œil la tendance centrale (médiane), la dispersion (intervalle interquartile) et la présence de valeurs aberrantes. Construire ce graphique est une compétence essentielle pour comparer les performances de plusieurs agences bancaires, analyser les temps de réponse des services d’urgence dans différentes communes de Lubumbashi, ou auditer la qualité des données de production agricole avant analyse.
VI.3 L’asymétrie (Skewness)
L’analyse de la forme d’une distribution révèle des informations cruciales sur les phénomènes sous-jacents. Une distribution des revenus asymétrique à droite (positive) en RDC, avec une longue queue de hauts revenus, est une réalité statistique. Savoir la mesurer et l’interpréter est vital pour comprendre que la majorité des travailleurs gagne moins que le revenu moyen, ce qui a des implications directes pour la conception de la fiscalité et des politiques de redistribution sociale.
VI.4 L’aplatissement (Kurtosis)
Qualifiant la concentration des valeurs autour de la moyenne, l’aplatissement (kurtosis) mesure l’acuité du pic de la distribution et l’épaisseur de ses queues. Une distribution leptokurtique (kurtosis élevé) des retours sur un investissement financier en RDC indique un risque d’événements extrêmes (forts gains ou fortes pertes) plus élevé que ne le suggérerait une distribution normale. Cet indicateur est donc un outil de gestion du risque avancé pour les analystes financiers et les gestionnaires de fonds.
ANNEXES
A. Glossaire des Termes Clés en Statistique Sociale
Une terminologie unifiée constitue le socle de toute analyse rigoureuse des données sociales. Cet index définit de manière concise les concepts fondamentaux (population, échantillon, variable, modalité) et les indicateurs clés (moyenne, médiane, variance). Sa maîtrise garantit la production de rapports clairs et non ambigus, essentiels pour communiquer efficacement les résultats d’une enquête sur le climat social d’une entreprise à Kinshasa ou pour interpréter les statistiques de l’emploi fournies par l’INS (Institut National de la Statistique).
B. Formulaire des Indicateurs de Statistique Descriptive
Synthèse opératoire des outils de calcul, ce formulaire regroupe l’ensemble des équations mathématiques indispensables à l’analyse descriptive. De la moyenne arithmétique à l’écart-type, en passant par le calcul des quartiles, chaque formule est présentée pour une application directe. Cet outil de référence est conçu pour l’assistant en statistiques RH qui doit, sous pression, quantifier rapidement la dispersion des salaires dans une société minière du Lualaba ou évaluer la tendance centrale des scores de satisfaction des employés.
C. Tutoriel d’Application : Statistique Descriptive sur Microsoft Excel
Face à la nécessité d’une analyse rapide, la maîtrise d’un tableur est un atout professionnel décisif. Ce guide pratique détaille, étape par étape, l’utilisation des fonctions statistiques (MOYENNE, ECARTYPE.P, QUARTILE) et la création de graphiques pertinents (histogrammes, diagrammes en bâtons) sur Microsoft Excel. Il transforme l’étudiant en un technicien capable de produire immédiatement des tableaux de bord synthétiques pour le suivi des indicateurs de performance RH dans une PME de Lubumbashi.
D. Jeu de Données : Enquête sur le Climat Social d’une PME Congolaise
Pour une mise en situation professionnelle authentique, cette annexe fournit un jeu de données brutes simulant une enquête menée au sein d’une PME de Goma. Il inclut des variables quantitatives (âge, salaire, ancienneté) et qualitatives (département, niveau de satisfaction). L’étudiant est invité à mobiliser les compétences acquises pour nettoyer, organiser, analyser et visualiser ces informations, préparant ainsi un rapport d’analyse concret destiné à un comité de direction fictif.
Discussion (0)
Aucune intervention pour le moment. Soyez le premier à contribuer.
Votre intervention Annuler la réponse