Statistique inférentielle

Fondements de la statistique mathématique de niveau approfondi.

Édition 2026 – Réforme LMD – Enseignement supérieur et universitaire en RDC.

Code Officiel : STI2121
Domaine : Sciences et Technologie
Filière : Statistique
Mention : Tronc Commun Statistique
Année d’étude : MASTER 1
Semestre : Semestre 2

Consulter les Modalités, Compétences et Débouchés

Cette unité d’enseignement, valorisée à hauteur de 4 crédits ECTS, est entièrement architecturée autour d’un unique Élément Constitutif d’une densité exceptionnelle : la Statistique mathématique approfondie. Cette structure monobloc garantit une immersion totale et rigoureuse dans les fondements théoriques et les applications avancées de la discipline, constituant un pilier fondamental de votre parcours académique en modélisation quantitative.

Au-delà de la théorie, cette UE vise à vous doter de compétences opérationnelles de haut niveau. Vous apprendrez à garantir la fiabilité prédictive de vos modèles sur de grands volumes de données en démontrant les propriétés asymptotiques des estimateurs. En vous appuyant sur la théorie de la décision, vous saurez construire des tests d’hypothèses optimaux pour éclairer la prise de décision stratégique en environnement incertain. Enfin, vous maîtriserez la modélisation de l’incertitude grâce à des théorèmes de convergence avancés, vous permettant de capturer la dynamique de phénomènes complexes.

Cette expertise de pointe ouvre la voie à des carrières d’impact, particulièrement stratégiques pour le développement économique de la République Démocratique du Congo. Le Statisticien-mathématicien devient un acteur clé pour les instituts nationaux et les plans de développement. Le Concepteur de modèles stochastiques innove dans les secteurs bancaire et assurantiel en pleine expansion, tandis que l’Analyste de risques est indispensable à la sécurisation des investissements massifs dans le secteur minier et les grands projets d’infrastructure, évaluant avec précision les aléas financiers et opérationnels.

SOMMAIRE NAVIGABLE

PRÉLIMINAIRES
Chapitre I. Fondements Mathématiques et Probabilistes pour l’Inférence
Chapitre II. Théorie de l’Estimation Ponctuelle et Propriétés Asymptotiques
Chapitre III. Estimation par Intervalle et Régions de Confiance
Chapitre IV. Théorie des Tests d’Hypothèses et Optimalité Décisionnelle
Chapitre V. Modèles Avancés, Convergence Stochastique et Applications
ANNEXES

PRÉLIMINAIRES

I. Épistémologie et Enjeux Scientifiques du Domaine

L’inférence statistique, en rupture avec la simple description des données, constitue une révolution intellectuelle initiée par Fisher, Neyman et Pearson. Elle formalise le passage de l’observation d’un échantillon à la généralisation sur une population entière, en quantifiant rigoureusement l’incertitude inhérente à ce saut inductif. Ce cours aborde la statistique comme une branche des mathématiques appliquées dont l’enjeu est la construction de modèles probabilistes et la validation de leur adéquation au réel. L’objectif est de dépasser l’application mécanique de formules pour maîtriser la logique décisionnelle sous-jacente à toute conclusion scientifique.

II. Cartographie des Compétences et Transversalité

Les compétences visées forment le triptyque fondamental du statisticien-mathématicien moderne. Démontrer les propriétés asymptotiques des estimateurs garantit la robustesse des inférences sur de grands ensembles de données, une compétence cruciale en actuariat et en épidémiologie. La construction de tests optimaux via la théorie de la décision arme l’analyste contre les erreurs de jugement coûteuses, trouvant des applications directes en contrôle qualité industriel et en finance de marché. Enfin, la modélisation de l’incertitude par les théorèmes de convergence avancés est la clé pour le concepteur de modèles stochastiques complexes.

III. Alignement Stratégique avec les Réalités Opérationnelles

Ce savoir-faire mathématique se traduit directement en valeur économique sur le marché du travail congolais et africain. Un statisticien-mathématicien capable de démontrer la convergence d’un estimateur peut optimiser les stratégies d’échantillonnage pour des enquêtes nationales (INS) ou des études de marché à moindre coût. Le concepteur de modèles stochastiques devient indispensable aux banques et assurances pour évaluer les risques de crédit ou climatiques. L’analyste de risques, quant à lui, utilise ces outils pour sécuriser les chaînes d’approvisionnement ou quantifier l’impact d’une politique publique.

Chapitre I. Fondements Mathématiques et Probabilistes pour l’Inférence

I.1 Espace de Probabilité et Théorème de Radon-Nikodym

Fondée sur la théorie de la mesure, la statistique mathématique exige une maîtrise absolue de l’espace probabilisé (Ω, F, P). Ce segment dissèque la construction axiomatique de Kolmogorov, socle de toute modélisation stochastique rigoureuse. L’accent est mis sur le théorème de Radon-Nikodym, qui justifie l’existence des densités de probabilité et établit le lien formel entre mesures discrètes et continues. Cette abstraction est la condition nécessaire pour manipuler des concepts avancés comme la vraisemblance et l’information de Fisher dans des contextes non-élémentaires.

I.2 Espérance Conditionnelle et Intégration de Lebesgue

Au cœur de la théorie de l’estimation, l’espérance conditionnelle est redéfinie non comme une simple formule, mais comme une projection orthogonale dans un espace de Hilbert L². Cette vision géométrique, permise par l’intégrale de Lebesgue, unifie le traitement des variables aléatoires discrètes et continues et fonde les propriétés des estimateurs optimaux. L’étudiant apprendra à manipuler cet outil pour démontrer des théorèmes fondamentaux, comme celui de Rao-Blackwell, qui fournit une méthode systématique pour améliorer n’importe quel estimateur non-biaisé.

I.3 Critique des Modèles Paramétriques et Robustesse

La pertinence d’un modèle paramétrique repose sur des hypothèses fortes, souvent violées en pratique. Cette section introduit une critique systématique de l’approche paramétrique classique, en analysant la sensibilité des estimateurs aux observations aberrantes (outliers) et aux erreurs de spécification du modèle. Des concepts comme la fonction d’influence de Hampel sont introduits pour quantifier la robustesse. L’objectif est de développer un scepticisme méthodologique, préparant le terrain pour les approches non-paramétriques et semi-paramétriques qui sont souvent plus réalistes.

I.4 Application à la Modélisation des Données Économiques Informelles

Face à la prédominance du secteur informel en RDC, les données économiques sont souvent incomplètes, bruitées et non-conformes aux lois de probabilité classiques. Ce cas pratique consiste à construire un modèle probabiliste adéquat pour les revenus journaliers des petits commerçants de Kinshasa. L’étudiant devra justifier le choix d’une loi (e.g., Lognormale, Pareto) en s’appuyant sur les outils du chapitre, critiquer ses limites et proposer une première ébauche de procédure d’estimation robuste, tenant compte de la nature parcellaire des données collectées sur le terrain.

Chapitre II. Théorie de l’Estimation Ponctuelle et Propriétés Asymptotiques

II.1 Concepts Fondamentaux de l’Estimation Statistique

Un estimateur est une fonction des observations, une statistique, dont le but est d’approcher une caractéristique inconnue de la population. Ce sous-chapitre formalise les qualités désirables d’un bon estimateur : le biais, la variance, et l’erreur quadratique moyenne (EQM). La distinction cruciale entre l’estimation (le processus) et l’estimé (la valeur numérique) est martelée. L’analyse du compromis biais-variance est introduite comme le dilemme central de l’estimation, posant les bases pour la recherche de procédures optimales dans des classes d’estimateurs restreintes.

II.2 Méthodes de Construction : Maximum de Vraisemblance et Moments

La méthode du maximum de vraisemblance (EMV), héritage de R.A. Fisher, constitue une approche quasi-universelle pour construire des estimateurs aux propriétés asymptotiques remarquables. Sa mise en œuvre pratique via l’optimisation numérique est détaillée, tout comme ses liens avec la théorie de l’information. En parallèle, la méthode des moments, plus simple mais souvent moins efficace, est présentée comme une alternative robuste et un outil d’initialisation. L’étudiant apprendra à dériver et calculer ces estimateurs pour les familles de lois usuelles.

II.3 Borne de Cramér-Rao et Efficacité des Estimateurs

La borne de Cramér-Rao établit une limite inférieure infranchissable pour la variance de tout estimateur sans biais, définissant ainsi la notion d’efficacité. Sa démonstration, qui repose sur l’inégalité de Cauchy-Schwarz et l’information de Fisher, est un point culminant de la théorie de l’estimation. Ce segment explore les conditions d’atteinte de cette borne, liant l’efficacité à l’appartenance à la famille exponentielle. La critique de cette borne, notamment son inapplicabilité aux estimateurs biaisés, ouvre la voie à des concepts plus généraux.

II.4 Mise en Situation : Estimation de la Prévalence d’une Maladie

À partir de données d’enquêtes sanitaires fragmentaires issues d’une province congolaise, l’étudiant doit estimer la prévalence d’une maladie (ex: paludisme). Il construira l’estimateur du maximum de vraisemblance, calculera son information de Fisher et vérifiera s’il est efficace. L’exercice mettra en lumière les propriétés asymptotiques (convergence, normalité) de l’estimateur, permettant de juger de la fiabilité de l’estimation malgré un budget d’enquête limité, une compétence essentielle pour les analystes en santé publique opérant avec des ressources contraintes.

Chapitre III. Estimation par Intervalle et Régions de Confiance

III.1 Dualité entre Tests d’Hypothèses et Intervalles de Confiance

Un intervalle de confiance n’est pas une déclaration probabiliste sur un paramètre fixe, mais l’inversion d’une procédure de test. Ce concept, souvent mal interprété, est ici la clé de voûte. Nous démontrons formellement que l’ensemble des valeurs d’un paramètre non rejetées par un test d’hypothèse de niveau α forme une région de confiance de niveau 1-α. Cette dualité offre une méthode de construction générale et une interprétation rigoureuse, immunisant le statisticien contre les erreurs conceptuelles les plus courantes.

III.2 Construction par la Méthode de la Quantité Pivotale

La méthode de la quantité pivotale est une technique fondamentale et élégante pour construire des intervalles de confiance exacts. Elle repose sur l’identification d’une fonction des observations et du paramètre dont la loi de probabilité est connue et indépendante du paramètre lui-même. Ce sous-chapitre détaille la méthode pour les paramètres de lois normales (moyenne, variance) et son application pour les grands échantillons via le Théorème Central Limite. La maîtrise de cette technique est indispensable pour fournir des marges d’erreur fiables.

III.3 Confrontation des Approches : Intervalles de Confiance vs. Intervalles de Crédibilité Bayésiens

La controverse entre fréquentistes et bayésiens trouve une illustration parfaite dans la construction des intervalles. Ce segment confronte l’intervalle de confiance fréquentiste, qui encadre un paramètre fixe avec une probabilité de succès à long terme, à l’intervalle de crédibilité bayésien, qui représente une plage de valeurs plausibles pour un paramètre considéré comme aléatoire. L’analyse critique des hypothèses (loi a priori) et des interprétations de chaque approche arme l’étudiant pour choisir la méthodologie la plus pertinente face à un problème concret.

III.4 Application : Encadrement du Rendement Agricole en Milieu Périurbain

Un agronome souhaite quantifier l’incertitude sur le rendement moyen d’une nouvelle variété de maïs testée sur des parcelles autour de Lubumbashi. L’étudiant devra utiliser les données d’un échantillon de parcelles pour construire un intervalle de confiance à 95% pour le rendement moyen. L’exercice impose de justifier le choix de la méthode (pivotale si possible, asymptotique sinon), d’interpréter l’intervalle obtenu pour un décideur non-statisticien, et de calculer la taille d’échantillon nécessaire pour atteindre une précision désirée, optimisant ainsi le coût des futures expérimentations.

Chapitre IV. Théorie des Tests d’Hypothèses et Optimalité Décisionnelle

IV.1 Le Lemme Fondamental de Neyman-Pearson

Le lemme de Neyman-Pearson constitue la fondation de la théorie des tests optimaux. Il fournit une réponse définitive au problème du test d’une hypothèse simple contre une alternative simple : le test le plus puissant est celui basé sur le rapport de vraisemblance. La démonstration, élégante et constructive, est disséquée pour en extraire la logique décisionnelle. Ce résultat, bien que restrictif, est le point de départ pour la construction de tests dans des situations plus complexes et introduit la notion capitale de région critique.

IV.2 Tests Uniformément les Plus Puissants et Rapport de Vraisemblance Généralisé

Face à des hypothèses composites, la notion de test uniformément le plus puissant (UPP) devient centrale. Ce sous-chapitre explore les conditions d’existence de tels tests, notamment pour les familles de lois à rapport de vraisemblance monotone. Lorsque les tests UPP n’existent pas, le test du rapport de vraisemblance généralisé (TRVG) est introduit comme une heuristique puissante et flexible, dont les propriétés asymptotiques (convergence vers une loi du chi-deux) en font un outil quasi-universel en pratique pour la comparaison de modèles imbriqués.

IV.3 La Controverse de la p-valeur et la Taille de l’Effet

La p-valeur, omniprésente dans la littérature scientifique, est souvent fétichisée et mal interprétée, menant à une crise de la reproductibilité. Cette section déconstruit son usage en montrant qu’elle ne mesure ni la probabilité que l’hypothèse nulle soit vraie, ni l’importance de l’effet observé. La distinction vitale entre significativité statistique et pertinence pratique est établie, imposant le calcul systématique d’indicateurs de taille d’effet (Cohen’s d, odds ratio) comme complément indispensable pour une prise de décision éclairée et scientifiquement honnête.

IV.4 Cas Pratique : Test de l’Efficacité d’un Programme de Microcrédit

Une ONG en RDC a mis en place un programme de microcrédit et souhaite tester son impact sur le revenu des bénéficiaires. À partir de données d’un groupe traitement et d’un groupe contrôle, l’étudiant doit formuler les hypothèses nulle et alternative, construire le test statistique le plus approprié (test de Student, Wilcoxon), calculer la p-valeur et, crucialement, une mesure de la taille de l’effet. La conclusion devra être rédigée pour un manager de l’ONG, en expliquant clairement la portée et les limites des résultats statistiques.

Chapitre V. Modèles Avancés, Convergence Stochastique et Applications

V.1 Théorèmes de Convergence : Loi des Grands Nombres et Théorème Central Limite

Les propriétés asymptotiques des estimateurs reposent sur deux piliers : la Loi des Grands Nombres (LGN), qui assure la convergence de la moyenne empirique, et le Théorème Central Limite (TCL), qui spécifie sa vitesse de convergence et sa distribution limite normale. Ce sous-chapitre revisite ces théorèmes dans un cadre général (conditions de Lindeberg), en soulignant leur rôle fondamental pour justifier l’inférence sur de grands échantillons. La démonstration via les fonctions caractéristiques est esquissée pour asseoir la compréhension mathématique profonde de ces résultats.

V.2 Introduction aux Processus Stochastiques : Chaînes de Markov et Martingales

Pour modéliser des phénomènes évoluant dans le temps, les suites de variables i.i.d. sont insuffisantes. Ce segment introduit deux classes de processus à temps discret fondamentales : les chaînes de Markov, qui modélisent des systèmes avec une mémoire limitée, et les martingales, qui formalisent la notion de jeu équitable. Les propriétés de base (matrice de transition, distribution stationnaire, temps d’arrêt) sont définies. Ces outils sont la porte d’entrée vers la modélisation de séries temporelles financières, météorologiques ou épidémiologiques.

V.3 Limites de l’Inférence Classique et Introduction au Bootstrap

Lorsque la distribution de l’estimateur est inconnue ou trop complexe, et que les conditions asymptotiques ne sont pas remplies, l’inférence classique est paralysée. Le bootstrap, une méthode de rééchantillonnage intensive en calcul proposée par Efron, offre une alternative puissante. En simulant la distribution d’échantillonnage à partir des données elles-mêmes, il permet de construire des intervalles de confiance et de réaliser des tests dans des situations non-standards. Cette approche, gourmande en calcul mais conceptuellement simple, est une innovation frugale en théorie statistique.

V.4 Modélisation de la Volatilité des Prix sur un Marché Local

Les prix des denrées alimentaires sur les marchés de Goma sont notoirement volatils, affectés par des chocs sécuritaires et logistiques. L’étudiant est chargé de modéliser cette volatilité. En utilisant des données de prix réelles, il devra d’abord tester la présence de dépendance temporelle (autocorrélation), puis ajuster un modèle simple de type chaîne de Markov ou un modèle de volatilité stochastique. Le bootstrap sera utilisé pour quantifier l’incertitude sur les paramètres du modèle, fournissant un outil d’aide à la décision pour les acteurs de la sécurité alimentaire.

ANNEXES

A. Guide Pratique du Bootstrap et du Jackknife en R/Python

Cette annexe fournit un guide opérationnel pour l’implémentation des méthodes de rééchantillonnage. Pour le statisticien-mathématicien, elle détaille les algorithmes du bootstrap non-paramétrique et paramétrique, ainsi que la technique du Jackknife pour la correction de biais. Le code source commenté en R et Python permet de calculer des intervalles de confiance (percentile, BCa) pour des statistiques complexes (médiane, Gini) où la théorie est inopérante. C’est un outil essentiel pour l’analyste de risques confronté à des distributions non-standard ou des échantillons de petite taille.

B. Implémentation de Chaînes de Markov Monte Carlo (MCMC)

Destinée au concepteur de modèles stochastiques, cette annexe démystifie les algorithmes MCMC, notamment Metropolis-Hastings et l’échantillonneur de Gibbs. Elle explique comment ces techniques permettent d’explorer des distributions a posteriori complexes en inférence bayésienne, là où l’intégration analytique ou numérique classique échoue. Un exemple concret de calibration d’un modèle épidémiologique simple est développé pas à pas. La maîtrise de ces simulations est une compétence de pointe pour l’analyste de risques quantitatifs modélisant des systèmes complexes et incertains.

C. Protocole de Communication des Résultats Statistiques aux Décideurs

Cette annexe est un manuel de traduction du langage mathématique vers le langage décisionnel. Elle propose une structure-type pour un rapport d’analyse statistique destiné à un public non-spécialiste (manager, politique). Le protocole insiste sur la visualisation des données, la distinction claire entre corrélation et causalité, l’explication de l’incertitude via les intervalles de confiance, et la formulation de recommandations basées sur la taille de l’effet. Pour le statisticien-mathématicien, c’est la compétence finale qui transforme une analyse technique en impact stratégique.

Inférence en Zone de Crise : De la Rigueur Statistique à la Pertinence Opérationnelle

► Comment justifier un échantillonnage aléatoire simple dans des communautés rurales où les structures de pouvoir sont très hiérarchisées ?

La justification de l’échantillonnage aléatoire simple face à des structures hiérarchisées est un piège. L’approche de Nassim Nicholas Taleb sur le “Cygne Noir” nous enseigne que nos modèles échouent en ignorant les événements rares mais à fort impact, comme l’influence d’un chef coutumier. Appliquer un modèle qui suppose l’homogénéité et l’indépendance des individus est une “erreur ludique” : on traite la complexité sociale comme un jeu de casino. La solution n’est pas de rejeter l’inférence, mais d’adapter la méthode. Un échantillonnage stratifié ou par grappes, qui intègre explicitement ces hiérarchies comme strates ou unités primaires, est conceptuellement plus honnête et opérationnellement plus robuste.

📚 Source :Travaux de Nassim Nicholas Taleb sur Le Cygne Noir via Google Books

► Quel est le risque majeur de l’inférence prédictive via machine learning avec des données collectées en contexte dégradé ?

Le risque majeur est l’overfitting, ou surajustement. Avec des données dégradées, un modèle complexe de machine learning peut apprendre le bruit et les biais du système de collecte plutôt que le signal réel. On obtient alors un modèle parfaitement ajusté à des données erronées, mais totalement inutile, voire dangereux, pour la prédiction. C’est ici que le principe de George Box, “tous les modèles sont faux, mais certains sont utiles”, devient une arme. Il nous force à privilégier la parcimonie : un modèle plus simple, plus robuste et plus interprétable sera infiniment plus “utile” sur le terrain qu’une boîte noire complexe et fragile.

📚 Source :Travaux de George Box sur All models are wrong via Wikipedia (FR)

► En pleine épidémie de choléra au Kivu, comment estimer un taux de létalité fiable avec des données partielles ?

L’urgence impose une solution pragmatique. La méthode de Capture-Recapture, développée pour l’épidémiologie par Chandrasekaran et Deming, est l’outil de choix. On traite deux sources de données indépendantes mais incomplètes (ex: registres d’un centre de santé et listes d’un agent communautaire) comme deux “captures”. En analysant le nombre de patients présents dans les deux listes (la “recapture”), on peut estimer statistiquement la population totale de malades, y compris ceux qui n’ont été vus par personne. Ce dénominateur, plus robuste, permet alors de calculer un taux de létalité beaucoup plus proche de la réalité, guidant ainsi la réponse de manière efficace.

📚 Source :Travaux de Chandrasekaran & Deming sur Capture-Recapture via JSTOR

► Au-delà de la valeur-p, quel principe statistique est le plus vital pour un analyste terrain en Afrique centrale ?

Le principe le plus vital est la maîtrise du concept de “variable de confusion” (confounding), tel que formalisé par Judea Pearl. En Afrique centrale, les corrélations sont omniprésentes et trompeuses. Un analyste doit traquer sans relâche les facteurs tiers qui affectent à la fois une intervention (ex: un programme de microcrédit) et un résultat (ex: le revenu des ménages). L’éducation, l’accès aux routes ou l’appartenance ethnique peuvent être de puissants facteurs de confusion. Sans utiliser un cadre causal rigoureux, comme les graphes orientés acycliques de Pearl, pour identifier et contrôler ces variables, l’analyste risque de produire des conclusions fausses.

📚 Source :Travaux de Judea Pearl sur Variable de confusion via Cairn.info

Discussion (0)

Aucune intervention pour le moment. Soyez le premier à contribuer.

Votre intervention Annuler la réponse

Tagged cours universitaire, estimateurs statistiques, RDC, sciences et technologie, Statistique inférentielle, tests d'hypothèses, théorèmes de convergence, théorie de la décision

Cours de Statistique Inférentielle en RDC | Sciences et Technologie