Graphique de distribution de probabilités avec des courbes complexes.

Théories des probabilités approfondies

Analyse théorique des probabilités de l'incertain et lois extrêmes

Édition 2026 – Réforme LMD – Enseignement supérieur et universitaire en RDC.

  • Code Officiel : TPA2131
  • Domaine : Sciences et Technologie
  • Filière : Statistique
  • Mention : Mathématique de Gestion
  • Année d’étude : MASTER 2
  • Semestre : Semestre 3
Consulter les Modalités, Compétences et Débouchés

Cette Unité d’Enseignement fondamentale, valorisée à 6 crédits ECTS, est conçue comme un triptyque cohérent pour maîtriser l’analyse probabiliste avancée. Son architecture s’articule autour de trois Éléments Constitutifs (EC) de 2 crédits chacun, formant un parcours progressif. L’étude débute par les fondements des Probabilités de l’incertain, se poursuit avec une spécialisation sur les Probabilités des distributions extrêmes, et s’achève par une exploration des techniques non paramétriques à travers les Distributions des statistiques de Rangs et de signes, garantissant une vision complète et intégrée de la modélisation des phénomènes aléatoires complexes.

L’objectif de cette UE est de forger des compétences analytiques de haut niveau, directement transposables en solutions concrètes. Les apprenants seront capables de modéliser l’incertitude au sein des systèmes dynamiques de gestion, leur permettant de piloter la performance en environnement volatile. En apprenant à caractériser les distributions asymptotiques des valeurs extrêmes, ils pourront quantifier et anticiper des événements rares mais à fort impact, comme les crises financières ou les catastrophes naturelles. La capacité à déterminer les lois exactes des statistiques de rangs leur offrira une méthodologie d’inférence robuste pour des prises de décision éclairées, même face à des données non conventionnelles, transformant l’analyse statistique en un avantage stratégique.

Ce cursus prépare à des métiers d’experts dont le rôle est crucial pour la sécurisation et le développement de l’économie en République Démocratique du Congo. Le Spécialiste des risques extrêmes est essentiel pour évaluer et mitiger les menaces sur les projets miniers et d’infrastructure. L’Actuaire, quant à lui, est indispensable au secteur des assurances et des caisses de retraite pour concevoir des produits viables et garantir la stabilité financière à long terme. Enfin, l’Analyste en sécurité financière joue un rôle de premier plan dans le renforcement du secteur bancaire et financier congolais, en luttant contre la fraude et en gérant l’exposition aux chocs des marchés, contribuant ainsi directement à la résilience économique nationale.

SOMMAIRE NAVIGABLE

PRÉLIMINAIRES

I. Épistémologie et Enjeux Scientifiques du Domaine

L’évolution de la théorie des probabilités, depuis les jeux de hasard de Pascal jusqu’à l’axiomatique de Kolmogorov, marque le passage d’une intuition de l’aléa à sa formalisation rigoureuse via la théorie de la mesure. Ce cours dépasse ce socle classique pour s’attaquer aux frontières modernes : la quantification de l’incertitude profonde et l’analyse des événements rares, dont la fréquence défie les lois de la moyenne. Il s’agit de fournir les outils mathématiques pour penser le cygne noir, l’imprévisible, et de structurer une rationalité décisionnelle face à l’inconnu structurel.

II. Cartographie des Compétences et Transversalité

Les compétences visées par cette UE forment un triptyque de haute spécialisation : modélisation de l’incertitude, caractérisation des extrêmes et inférence robuste. Loin d’être confinées aux mathématiques pures, elles irriguent des domaines critiques comme l’actuariat, où il faut tarifer le risque catastrophique, la finance quantitative, pour sécuriser les portefeuilles contre les krachs, et même l’hydrologie ou l’épidémiologie, pour anticiper les crues centennales ou les pics pandémiques. La maîtrise de ces outils confère une capacité d’analyse prédictive et de gestion de crise transversale, hautement valorisée.

III. Alignement Stratégique avec les Réalités Opérationnelles

Face aux défis socio-économiques du continent africain, cette expertise devient un levier stratégique. La modélisation des risques extrêmes est vitale pour concevoir des assurances agricoles adaptées à la volatilité climatique, pour dimensionner les infrastructures (barrages, digues) face à des pluviométries erratiques, ou pour stabiliser les marchés financiers émergents. Les métiers d’actuaire et d’analyste du risque ne sont plus un luxe mais une nécessité pour piloter le développement, attirer les investissements en sécurisant leur rentabilité et construire une résilience économique et sociale durable.

Chapitre I. Fondements Axiomatiques de l’Incertitude et Modélisation Stochastique

I.1 Axiomatique de Kolmogorov et Espaces de Probabilité

Formalisée en 1933 par Andreï Kolmogorov, l’axiomatique des probabilités a unifié la discipline en la fondant sur la théorie de la mesure. Cette section dissèque la structure (Ω, F, P), socle de toute modélisation rigoureuse de l’aléatoire. L’étudiant y maîtrisera la construction d’espaces probabilisés complexes, condition sine qua non pour aborder l’incertitude au-delà des cas d’école et quantifier le risque dans des systèmes non-déterministes avec une précision mathématique absolue, préparant le terrain pour la modélisation des systèmes de gestion dynamiques.

I.2 Variables Aléatoires, Lois et Espérances Conditionnelles

Au-delà de la simple assignation de probabilités, la puissance du formalisme réside dans l’étude des variables aléatoires et de leurs lois. Ce sous-chapitre se concentre sur l’espérance conditionnelle, un outil fondamental pour la prédiction et la mise à jour des croyances face à une information nouvelle. Sa maîtrise est non-négociable pour comprendre les processus stochastiques et la théorie des martingales. L’étudiant apprendra à la calculer et à l’interpréter comme la meilleure approximation d’une variable dans un contexte d’information partielle.

I.3 Critique des Limites du Modèle Classique

L’axiomatique kolmogorovienne, malgré sa puissance, repose sur une connaissance parfaite de l’espace des possibles, une hypothèse souvent irréaliste. Cette section introduit la critique de cette vision, notamment via les probabilités subjectives de De Finetti ou la théorie des fonctions de croyance de Dempster-Shafer. L’objectif est de confronter l’étudiant aux situations d’incertitude “Knightienne”, où les probabilités elles-mêmes sont inconnues. Il s’agit de développer un regard critique sur les outils pour en identifier les frontières de validité avant de les appliquer.

I.4 Application à la Modélisation des Flux Financiers Mobiles

Face à l’explosion des transactions de “mobile money” à Kinshasa ou Abidjan, la modélisation des flux devient un enjeu de stabilité financière. Ce cas pratique utilise les outils du chapitre pour construire un espace de probabilité décrivant les volumes de transactions journaliers. L’étudiant devra modéliser l’incertitude sur les dépôts et retraits en utilisant l’espérance conditionnelle pour prévoir les besoins de liquidité d’un agent, une compétence directement applicable pour un analyste en sécurité financière opérant sur le marché des télécommunications et des fintechs africaines.

Chapitre II. Processus Stochastiques et Modélisation de l’Incertitude Dynamique

II.1 Chaînes de Markov à Temps Discret et Comportement Asymptotique

Héritées des travaux d’Andreï Markov sur la poésie russe, les chaînes de Markov constituent le premier outil pour modéliser l’évolution d’un système où le futur ne dépend que du présent. Cette section établit leur formalisme, de la matrice de transition aux notions de classes et de périodicité. L’objectif est la maîtrise du comportement à long terme : existence et calcul de la probabilité stationnaire. Cette compétence est fondamentale pour analyser la stabilité des systèmes dynamiques en gestion, comme les parts de marché ou la fidélité client.

II.2 Martingales et Théorèmes d’Arrêt

Concept central de la probabilité moderne, la martingale formalise l’idée d’un jeu équitable et constitue un puissant outil d’analyse des processus sans “drift”. Ce segment explore la théorie des martingales à temps discret, incluant les théorèmes de convergence et le théorème d’arrêt optionnel de Doob. L’étudiant apprendra à identifier une martingale et à utiliser ses propriétés pour calculer des probabilités complexes ou borner des espérances. C’est la porte d’entrée vers la mathématique financière et l’évaluation des options sans arbitrage.

II.3 Limites de la Propriété Markovienne et Mémoire Longue

La supposition que le futur ne dépend que du présent est une simplification drastique, souvent violée dans les systèmes réels (financiers, climatiques) qui exhibent une mémoire longue. Cette partie analyse de manière critique les limites de l’hypothèse markovienne. Elle introduit des concepts alternatifs comme les processus à mémoire longue ou les modèles de volatilité stochastique (GARCH, etc.). L’étudiant apprendra à diagnostiquer la pertinence du modèle markovien et à reconnaître les situations où son application mènerait à des conclusions erronées.

II.4 Modélisation de la Progression d’une Épidémie en Contexte Urbain Africain

Sous l’angle de la santé publique, la propagation d’une maladie comme Ebola ou la Covid-19 dans une métropole dense peut être approchée par une chaîne de Markov (modèle SIR). L’étudiant devra construire une matrice de transition simple (Sain -> Infecté -> Rétabli) et calculer la distribution stationnaire pour évaluer le risque d’endémie. Ce cas d’étude démontre comment modéliser l’incertitude sur l’évolution d’un système de santé publique et fournir des indicateurs quantitatifs pour guider les décisions politiques en matière de confinement ou de vaccination.

Chapitre III. Théorie des Valeurs Extrêmes (EVT) : Blocs Maxima et Seuils

III.1 Le Problème des Extrêmes et le Théorème de Fisher-Tippett-Gnedenko

L’analyse des moyennes masque le risque contenu dans les queues de distribution. La théorie des valeurs extrêmes (EVT) s’attaque frontalement à ce problème en étudiant la loi du maximum d’une série de variables aléatoires. Ce sous-chapitre pose les fondations avec le théorème fondamental de Fisher-Tippett-Gnedenko. Il démontre que la loi des extrêmes ne peut converger que vers trois familles de distributions : Gumbel, Fréchet ou Weibull. L’étudiant saisira la puissance unificatrice de ce résultat pour la modélisation des événements rares.

III.2 Méthodologie des Blocs Maxima (BM) et Estimation des Paramètres

La première approche pratique de l’EVT est la méthode des blocs maxima, qui consiste à diviser les données en périodes et à ne retenir que le maximum de chaque bloc. Cette section détaille la mise en œuvre de cette technique, de la sélection de la taille de bloc à l’estimation des paramètres de la loi généralisée des valeurs extrêmes (GEV) par maximum de vraisemblance. L’étudiant acquerra une méthodologie rigoureuse pour ajuster un modèle GEV à des données et en extraire des informations cruciales.

III.3 Le Dilemme Biais-Variance dans le Choix de la Taille de Bloc

La méthode des blocs maxima, bien que simple, cache une difficulté majeure : le choix de la taille du bloc. Un bloc trop petit viole les conditions asymptotiques du théorème et introduit un biais ; un bloc trop grand réduit le nombre de points et augmente la variance des estimateurs. Cette section explore en profondeur ce dilemme biais-variance. L’étudiant apprendra à utiliser des outils graphiques et statistiques pour opérer un choix raisonné, en comprenant les conséquences de cette décision sur la validité du modèle final.

III.4 Application à la Télémétrie des Précipitations du Bassin du Congo

Face aux défis climatiques, la prévision des crues exceptionnelles du fleuve Congo est un enjeu vital pour la RDC. Ce cas d’étude applique la méthode des blocs maxima aux séries chronologiques de précipitations journalières. L’étudiant devra analyser les données pluviométriques, choisir une taille de bloc pertinente (annuelle, par exemple), ajuster une loi GEV et estimer le niveau de pluie décennal ou centennal. Cette compétence est directement monnayable auprès des agences de gestion de l’eau, des assureurs ou des projets d’infrastructures hydroélectriques.

Chapitre IV. Caractérisation Asymptotique et Modèles de Dépendance Extrême

IV.1 Approche par Dépassements de Seuil (Peaks-Over-Threshold)

Dépassant la contrainte des blocs maxima qui ignore une partie des données, l’approche par dépassements de seuil (POT) modélise directement la loi des observations excédant un seuil élevé. Le théorème de Pickands-Balkema-de Haan en constitue la pierre angulaire, montrant que cette loi conditionnelle converge vers une loi de Pareto généralisée (GPD). Cette section expose la supériorité théorique et l’efficacité de cette méthode pour l’analyse des extrêmes, en particulier lorsque les données sont rares, ce qui est fréquent en Afrique.

IV.2 Outils de Sélection du Seuil et Inférence sur la GPD

La mise en œuvre de l’approche POT repose sur un choix critique : la hauteur du seuil. Ce sous-chapitre fournit un arsenal d’outils pour cette tâche, incluant le graphique de la fonction d’espérance de vie moyenne résiduelle (MRL plot) et les graphiques de stabilité des paramètres. Une fois le seuil fixé, l’étudiant apprendra les techniques d’estimation des paramètres de la GPD. Il sera capable de quantifier la queue de distribution et de calculer des mesures de risque comme la Value-at-Risk (VaR) extrême.

IV.3 La Question de la Dépendance Sérielle des Extrêmes

Les théorèmes fondateurs de l’EVT supposent l’indépendance des données, une hypothèse souvent irréaliste pour les séries temporelles financières ou environnementales où les extrêmes surviennent en grappes (clusters). Cette partie aborde la question de la dépendance sérielle et introduit l’indice extrémal, un indicateur clé pour la mesurer. L’étudiant apprendra à “déclusteriser” les données avant l’application des modèles POT, une étape cruciale pour éviter une sous-estimation dramatique de la variance et donc du risque réel.

IV.4 Modélisation du Risque de Krach sur un Marché Boursier Africain

Appliquée à l’indice BRVM de la Bourse Régionale des Valeurs Mobilières d’Abidjan, l’approche POT permet de caractériser la distribution asymptotique des rendements négatifs extrêmes. L’étudiant devra sélectionner un seuil de perte, vérifier l’indépendance des dépassements et ajuster une loi GPD. L’objectif final est de calculer la VaR à 99.9% pour le portefeuille d’un investisseur. Cette analyse outille l’analyste en sécurité financière pour quantifier le risque de “cygne noir” sur un marché émergent et concevoir des stratégies de couverture adéquates.

Chapitre V. Fondements des Statistiques de Rangs et Tests Non-Paramétriques

V.1 Rupture avec le Paradigme Paramétrique : la Statistique de Rang

Face à des données dont la loi de probabilité est inconnue ou ne suit pas une distribution classique (normale, etc.), les méthodes paramétriques s’effondrent. La statistique non-paramétrique offre une alternative robuste en se basant non pas sur les valeurs elles-mêmes, mais sur leurs rangs. Ce sous-chapitre introduit ce changement de paradigme. L’étudiant comprendra comment la transformation en rangs immunise l’analyse contre les valeurs aberrantes et la non-normalité, garantissant la validité des conclusions même avec des données de faible qualité.

V.2 Construction des Tests de Signes et de Rang (Wilcoxon, Mann-Whitney)

Ce segment plonge au cœur de la mécanique des tests non-paramétriques les plus fondamentaux. Il détaille la construction de la statistique du test des signes pour données appariées et des statistiques des tests de Wilcoxon et de Mann-Whitney pour comparer deux échantillons. L’étudiant apprendra à calculer manuellement ces statistiques et à comprendre leur logique intuitive. La maîtrise de ces outils est essentielle pour mener des inférences valides lorsque les hypothèses paramétriques sont trop contraignantes ou invérifiables, une situation courante en sciences sociales.

V.3 Puissance Relative des Tests et Conditions d’Application

L’abandon des hypothèses paramétriques a un coût : une potentielle perte de puissance si les données suivaient en réalité une loi normale. Cette section analyse de manière critique le concept d’Efficacité Relative Asymptotique (ERA) pour comparer la performance des tests non-paramétriques à leurs équivalents paramétriques (test t de Student). L’étudiant apprendra à quantifier ce compromis et à identifier les situations où le gain en robustesse justifie la perte potentielle de puissance, et inversement, pour un choix de test éclairé.

V.4 Application à l’Évaluation d’un Programme de Microcrédit au Sénégal

Pour évaluer l’impact d’un programme de microcrédit sur le revenu des femmes entrepreneures à Dakar, une comparaison avant-après est nécessaire. Les données de revenu étant souvent asymétriques et non-normales, un test t serait inapproprié. L’étudiant appliquera le test des rangs signés de Wilcoxon pour comparer les revenus avant et après l’octroi du crédit. Cette mise en situation démontre la supériorité de l’approche non-paramétrique pour l’évaluation d’impact de projets de développement, où les données sont rarement “propres”.

Chapitre VI. Détermination des Lois Exactes et Inférence Robuste par les Rangs

VI.1 Détermination Combinatoire des Lois Exactes à Échantillon Fini

Contrairement aux tests paramétriques qui reposent sur des lois asymptotiques (normale, chi-deux), la beauté des tests de rangs réside dans la possibilité de déterminer la loi exacte de la statistique de test pour de petits échantillons. Ce sous-chapitre explore l’approche combinatoire qui sous-tend ce calcul. En énumérant tous les arrangements de rangs possibles sous l’hypothèse nulle, l’étudiant apprendra à construire la distribution de la statistique de Wilcoxon et à calculer une p-valeur exacte, sans aucune approximation, pour une inférence d’une rigueur absolue.

VI.2 Coefficients de Corrélation de Rang de Spearman et Kendall

Pour quantifier la relation monotone entre deux variables sans supposer de linéarité, les coefficients de corrélation de Pearson sont inadaptés. Cette section introduit les coefficients de corrélation de rang de Spearman (ρ) et de Kendall (τ). L’étudiant apprendra à les calculer et à interpréter leur valeur, mais surtout à comprendre leur robustesse face aux outliers qui fausseraient totalement un coefficient de Pearson. Ces outils sont indispensables pour analyser les liens dans des données ordinales ou non-normales.

VI.3 Limites de l’Inférence par les Rangs et Alternatives

Malgré leur robustesse, les méthodes basées sur les rangs ne sont pas une panacée. Elles perdent de l’information en ignorant l’amplitude des différences et peuvent être moins puissantes que des transformations de données bien choisies (log, Box-Cox) si la loi sous-jacente est connue. Cette partie critique discute de ces limites et présente des alternatives comme les tests de permutation ou le bootstrap. L’objectif est de doter l’étudiant d’un panorama complet des méthodes d’inférence robustes, au-delà des seuls rangs.

VI.4 Analyse de la Préférence des Consommateurs pour des Produits Agricoles Locaux

Un actuaire travaillant pour une assurance agricole au Kenya souhaite savoir si la préférence des consommateurs (classée de 1 à 10) pour une nouvelle variété de maïs est liée à son prix. Les données de préférence étant ordinales, une corrélation de Pearson serait erronée. L’étudiant devra calculer le coefficient de corrélation de rang de Spearman pour tester l’existence d’une relation monotone. Cette compétence permet de tirer des conclusions valides à partir de données d’enquêtes qualitatives, cruciales pour la tarification et le marketing de produits.

ANNEXES

A. Guide de Calcul du Conditional Value-at-Risk (CVaR)

Destiné à l’actuaire et à l’analyste en sécurité financière, ce guide dépasse la simple Value-at-Risk (VaR) en répondant à la question cruciale : “Si la VaR est dépassée, quelle est la perte moyenne attendue ?”. Le CVaR, ou Expected Shortfall, offre une mesure de risque cohérente et plus sensible aux pertes extrêmes. L’annexe détaille sa formulation mathématique et sa méthode de calcul à partir d’une distribution de pertes, fournissant un outil supérieur pour la gestion de portefeuille, le calcul de capital réglementaire et la tarification des risques catastrophiques.

B. Protocole de Modélisation Peaks-Over-Threshold (POT) sous R

Cet outil est un protocole de programmation pour le spécialiste des risques extrêmes. Il fournit le code R commenté pour implémenter une analyse POT complète sur une série temporelle : importation des données, outils graphiques (MRL plot) pour la sélection du seuil, ajustement d’une loi de Pareto Généralisée (GPD) avec la librairie extRemes, et calcul des niveaux de retour. Appliqué aux débits d’un fleuve ou aux pertes d’un actif financier, ce protocole transforme la théorie des chapitres III et IV en une analyse quantitative reproductible et directement exploitable.

C. Mise en Œuvre du Test de Wilcoxon-Mann-Whitney pour Données Non Appariées

Cette annexe est un manuel opératoire pour l’analyste confronté à la comparaison de deux groupes indépendants lorsque les conditions du test t de Student ne sont pas remplies. Elle détaille la procédure pas à pas : formulation des hypothèses, regroupement et rangement de toutes les observations, calcul de la somme des rangs pour chaque groupe, et comparaison de la statistique de test aux valeurs critiques tabulées ou via l’approximation normale. Cet outil garantit une inférence rigoureuse pour l’évaluation d’impact (ex: groupe traitement vs groupe contrôle) avec des données réelles.

Probabilités en Contexte Extrême : De l’Abstraction Bayesienne à la Praxis Congolaise
Comment le paradoxe de Simpson peut-il fausser l’évaluation de l’efficacité d’une aide humanitaire dans plusieurs provinces congolaises ?
Le paradoxe de Simpson est une menace critique en évaluant l’aide humanitaire à travers diverses provinces congolaises. Un programme peut sembler efficace globalement mais délétère dans chaque province si une variable de confusion, comme l’infrastructure préexistante, est ignorée. Pour démanteler cette illusion, il faut dépasser la simple observation. Le ‘Do-calculus’ de Judea Pearl fournit le langage formel pour intervenir. En modélisant le graphe causal et en appliquant l’opérateur ‘do’, nous simulons une intervention, neutralisant l’effet du facteur de confusion. Cela permet d’isoler l’impact causal réel de l’aide, assurant que les données agrégées reflètent la réalité du terrain plutôt qu’un artefact statistique.

📚 Source :Travaux de Judea Pearl sur Do-calculus via Google Scholar

Face à des données épidémiologiques rares et bruitées, comment fiabiliser les modèles prédictifs de type Monte-Carlo en RDC ?
Les simulations Monte-Carlo standards échouent souvent en RDC car elles supposent des distributions gaussiennes, sous-estimant les événements extrêmes. Avec des données épidémiologiques rares, cela mène à des prédictions dangereusement optimistes. Il faut intégrer le cadre de Nassim Nicholas Taleb, spécifiquement son analyse des distributions à ‘queues épaisses’ (fat tails). Au lieu de se fier à une moyenne fragile, nous devons utiliser des méthodes statistiques robustes et tester nos modèles contre des scénarios extrêmes. Cela implique d’incorporer des lois de puissance ou d’utiliser le bootstrapping pour générer des intervalles de confiance plus réalistes, reconnaissant ainsi l’incertitude profonde et le potentiel d’épidémies catastrophiques.

📚 Source :Travaux de Nassim Nicholas Taleb sur Fat-tailed distributions via Google Books

Une chaîne logistique est rompue au Kivu. Comment allouer les ressources restantes en temps réel sous incertitude radicale ?
Lors d’une rupture logistique au Kivu, les probabilités objectives sont inexistantes ; nous faisons face à une incertitude radicale. La stratégie n’est pas d’attendre des données parfaites mais d’agir via un cadre structuré. La théorie de l’utilité espérée subjective (Subjective Expected Utility) de Leonard Jimmie Savage est l’outil opérationnel. Nous devons immédiatement obtenir des probabilités subjectives d’experts de terrain sur divers scénarios (sécurité des routes, etc.) et assigner des valeurs d’utilité aux résultats pour chaque choix d’allocation. La décision maximisant l’utilité espérée, même subjective, devient la plus rationnelle, formalisant l’intuition et rendant la décision défendable et adaptable à toute nouvelle information.

📚 Source :Travaux de Leonard Jimmie Savage sur Subjective Expected Utility via JSTOR

Comment la théorie des jeux évolutionnistes peut-elle modéliser la coopération (ou sa faillite) entre ONG concurrentes sur le terrain ?
La compétition entre ONG dans un environnement de ressources rares est une application parfaite de la théorie des jeux évolutionnistes. Pour modéliser cela, nous utilisons le concept de Stratégie Évolutionnairement Stable (SES) de John Maynard Smith. Une SES est une stratégie qui, si adoptée par une population, ne peut être envahie par aucune stratégie mutante alternative. Nous modélisons les interactions comme un jeu où ‘Coopérer’ (partager l’info) et ‘Trahir’ (garder les ressources) sont les options. En analysant les gains, nous déterminons si la coopération est une SES, ou si une stratégie mixte est plus stable, expliquant ainsi l’équilibre fragile souvent observé sur le terrain.

📚 Source :Travaux de John Maynard Smith sur Evolutionarily Stable Strategy via Wikipedia (FR)


Discussion (0)

Aucune intervention pour le moment. Soyez le premier à contribuer.

Votre intervention Annuler la réponse

Leave a Reply

Your email address will not be published. Required fields are marked *