Étudiant utilisant un ordinateur pour analyser des manuscrits anciens.

Outils de base

Maîtrise des instruments technologiques du philologue.

Édition 2026 – Réforme LMD – Enseignement supérieur et universitaire en RDC.

Code Officiel : OBA1361
Domaine : Domaine de Lettres, Langues et Arts
Filière : Lettres et Sciences Humaines
Mention : Lettres Latines
Année d’étude : Licence 3
Semestre : Semestre 6

Consulter les Modalités, Compétences et Débouchés

Cette Unité d’Enseignement, valorisée à hauteur de 5 crédits ECTS, s’articule autour d’un Élément Constitutif principal dédié à l’Anglais, qui représente à lui seul 3 crédits. L’architecture pédagogique est conçue pour intégrer de manière cohérente les savoirs, en mettant un accent particulier sur la maîtrise linguistique comme pilier fondamental de la formation et de la recherche future.

L’objectif de cette UE est de doter les apprenants de compétences hybrides, leur permettant d’exploiter les outils informatiques et de mobiliser des ressources numériques pour l’analyse et le traitement automatique de textes anciens. Cette maîtrise technique, appliquée notamment aux lettres latines, est indissociable d’une capacité à communiquer en anglais technique, compétence essentielle pour diffuser les résultats de recherche et collaborer efficacement au sein de la communauté scientifique internationale.

Les débouchés professionnels visés forment des experts de la donnée textuelle, tels que le Philologue documentaliste, l’Assistant d’édition numérique ou le Gestionnaire de bases de données textuelles. En République Démocratique du Congo, ces profils jouent un rôle crucial dans la valorisation et la préservation du patrimoine documentaire national. Leur expertise est indispensable pour la numérisation des archives, la gestion des corpus linguistiques locaux et la création d’éditions critiques accessibles, contribuant ainsi directement à la souveraineté culturelle et scientifique du pays sur le marché de l’emploi.

PRÉLIMINAIRES

I. Justification et Pertinence Socio-Économique

Cette Unité d’Enseignement (UE) est conçue pour combler le fossé entre la formation classiciste traditionnelle et les exigences du marché de l’emploi numérique. En RDC, la valorisation du patrimoine documentaire, qu’il soit manuscrit ou imprimé, représente un enjeu stratégique. La maîtrise des outils de la philologie numérique transforme le latiniste en un technicien de haut niveau, capable de piloter des projets de numérisation, de créer des bases de données textuelles pour les institutions culturelles (musées, archives nationales) et de contribuer à la visibilité internationale du savoir congolais.

II. Compétences Visées et Débouchés Professionnels

L’objectif est de rendre l’étudiant immédiatement opérationnel. Les compétences développées – encodage XML-TEI, gestion de bases de données textuelles, analyse de corpus, communication scientifique en anglais – répondent directement aux besoins des métiers de philologue documentaliste, d’assistant d’édition numérique et de gestionnaire de patrimoine culturel digital. Ces profils sont recherchés pour la mise en place d’archives numériques, la publication de revues scientifiques en ligne et la valorisation des fonds documentaires des universités et bibliothèques congolaises.

III. Modalités d’Évaluation

L’évaluation combine un contrôle continu et un examen terminal pour mesurer la maîtrise théorique et pratique. Le contrôle continu (40%) repose sur des travaux pratiques d’encodage de textes, la constitution d’un mini-corpus et une présentation en anglais technique. L’examen final (60%) consiste en la réalisation d’un micro-projet de A à Z : numérisation, encodage, analyse et rédaction d’un rapport de synthèse, simulant une mission professionnelle réelle et validant l’aptitude de l’étudiant à intégrer un environnement de travail exigeant.

PARTIE 1 : Ingénierie Philologique et Humanités Numériques

Chapitre I. Fondements de la Philologie Numérique et Ancrage Congolais

I.1 De la critique textuelle aux humanités numériques

Héritière de la critique textuelle séculaire, la philologie numérique en augmente la puissance par l’apport de l’informatique. Ce sous-chapitre établit la filiation conceptuelle entre l’ecdotique classique et les nouvelles méthodes computationnelles. L’étudiant saisira comment l’analyse de la tradition manuscrite, la collation et l’établissement d’un texte critique sont désormais assistés et optimisés par des algorithmes, préparant le terrain pour des analyses à grande échelle impossibles manuellement.

I.2 Enjeux de la valorisation du patrimoine documentaire en RDC

Face à la nécessité de préserver et diffuser le patrimoine écrit congolais, y compris les textes latins produits localement (archives missionnaires, documents administratifs coloniaux), la philologie numérique offre des solutions concrètes. Ce segment analyse les défis logistiques et techniques de la numérisation en contexte congolais et démontre comment la création d’archives numériques ouvertes peut stimuler la recherche locale, renforcer l’identité culturelle et créer une nouvelle chaîne de valeur économique autour du savoir.

I.3 Concepts clés : numérisation, OCR, métadonnées et interopérabilité

Une maîtrise rigoureuse du vocabulaire technique est un prérequis. Ce point définit et articule les concepts fondateurs : la numérisation (capture d’image), la reconnaissance optique de caractères (OCR) et son adaptation aux textes anciens, et les métadonnées (données décrivant les données). L’accent est mis sur l’interopérabilité, principe vital pour que les ressources numériques créées en RDC puissent dialoguer avec les grandes bases de données internationales, assurant leur pérennité et leur visibilité.

I.4 Cartographie de l’écosystème logiciel du philologue numérique

Cartographier l’écosystème logiciel permet à l’étudiant de se repérer et de choisir l’outil adéquat pour chaque tâche. Sont présentés les logiciels libres et propriétaires majeurs pour l’édition de texte (oXygen XML Editor), l’analyse de corpus (AntConc, Voyant Tools), la gestion bibliographique (Zotero) et la visualisation de données (Gephi). L’objectif est de fournir une vision panoramique et critique des instruments qui constitueront sa caisse à outils professionnelle.

Chapitre II. Encodage et Structuration des Textes Latins (TEI-XML)

II.1 Le langage XML : syntaxe et logique de la structuration

Fondamental pour la structuration de l’information, le langage XML (eXtensible Markup Language) est ici abordé non comme une fin mais comme un moyen au service de l’analyse textuelle. L’étudiant apprendra sa syntaxe (balises, attributs, entités) et sa logique hiérarchique pour modéliser la structure d’un document. Cette compétence est la pierre angulaire de la création de documents numériques exploitables, bien au-delà de la simple mise en forme visuelle.

II.2 La Text Encoding Initiative (TEI) : un standard pour les humanités

Standard de facto dans les humanités numériques, la TEI fournit un vocabulaire XML exhaustif pour décrire finement les textes littéraires, historiques et linguistiques. Ce sous-chapitre présente les modules principaux de la TEI (structure, apparat critique, noms propres, etc.). L’étudiant comprendra comment ce cadre normalisé garantit la pérennité, l’échange et l’analyse comparée des textes encodés, un atout majeur pour des projets collaboratifs nationaux ou internationaux.

II.3 Atelier pratique : encodage d’un texte latin avec apparat critique

L’application pratique de l’encodage transforme la théorie en compétence. À partir d’un extrait d’un auteur classique (ex: Cicéron) avec ses variantes manuscrites, l’étudiant réalisera un encodage TEI complet. Il apprendra à baliser la structure du discours, les entités nommées (personnes, lieux), les figures de style et, surtout, à formaliser un apparat critique. Cet exercice concret le rendra apte à produire une édition numérique simple mais rigoureuse.

II.4 Validation du code : DTD, Schémas XML et bonnes pratiques

Sous l’angle de la rigueur et de la qualité des données, la validation est une étape non négociable. Ce segment introduit les mécanismes de validation (DTD, XML Schema, Relax NG) qui permettent de vérifier la conformité d’un document XML à un modèle prédéfini (comme la TEI). L’étudiant apprendra à lire les messages d’erreur et à déboguer son code, une compétence technique essentielle pour garantir la fiabilité et l’exploitabilité à long terme des données produites.

Chapitre III. Constitution et Interrogation de Corpus Textuels

III.1 Du texte unique au corpus : principes de la linguistique de corpus

Au-delà de la simple collection de textes, un corpus est un ensemble de données textuelles structuré et sélectionné pour l’analyse linguistique. Ce sous-chapitre expose les principes méthodologiques de la constitution de corpus : représentativité, équilibre, annotation. L’étudiant apprendra à concevoir un corpus en fonction d’une hypothèse de recherche précise, passant de l’analyse qualitative d’un texte unique à l’analyse quantitative de phénomènes linguistiques à grande échelle.

III.2 Stratégies de constitution d’un corpus latin pour la RDC

La constitution d’un corpus localisé est un acte scientifique et patrimonial. Ce point détaille les stratégies pour rassembler des textes latins pertinents pour le contexte congolais : identification des sources dans les archives nationales, récupération de textes via des API de bibliothèques numériques (Gallica, HathiTrust), et techniques de web scraping éthique. L’objectif est de doter l’étudiant des méthodes pour créer des ressources primaires inédites et à forte valeur ajoutée locale.

III.3 Interrogation avancée : XPath et XQuery pour les documents XML

Pour extraire une information ciblée d’un corpus encodé en XML-TEI, la maîtrise des langages de requête est indispensable. Ce sous-chapitre offre une introduction pratique à XPath (pour naviguer dans un document) et XQuery (pour interroger des collections de documents). L’étudiant sera capable de formuler des requêtes complexes, par exemple “extraire toutes les subordonnées circonstancielles de but dans les discours de Caton” ou “lister tous les lieux cités par Pline l’Ancien”.

III.4 Analyse quantitative et lexicométrie avec des outils dédiés

L’analyse quantitative des textes révèle des patrons invisibles à la lecture simple. Via des outils comme Voyant Tools ou TXM, l’étudiant explorera les techniques de base de la lexicométrie : calcul de fréquences, analyse des cooccurrences, identification de spécificités lexicales. Appliqué à un corpus latin, cela permet de comparer le style de deux auteurs, de suivre l’évolution sémantique d’un terme ou d’identifier des thèmes récurrents de manière objective et chiffrée.

Chapitre IV. Gestion de Données Philologiques : Bases de Données et Métadonnées

IV.1 Problématique de la persistance des données textuelles

Dépassant les limites du fichier plat, les bases de données offrent une solution robuste pour stocker, gérer et interroger de grands volumes de données philologiques. Ce segment expose la problématique de la persistance et de l’accès concurrentiel aux données. L’étudiant comprendra pourquoi une base de données est supérieure à un simple dossier de fichiers XML pour gérer un projet d’édition numérique collaboratif ou une archive textuelle destinée à être consultée en ligne.

IV.2 Le modèle relationnel (SQL) pour les métadonnées et les données structurées

Le modèle relationnel, par sa structure tabulaire rigide, est idéal pour gérer les métadonnées descriptives d’un corpus (auteur, date, source manuscrite) ou des données linguistiques structurées (lexiques, index). L’étudiant sera initié aux concepts de tables, de clés primaires/étrangères et au langage SQL pour effectuer des requêtes de base. Il pourra ainsi concevoir un catalogue informatique pour une bibliothèque numérique ou une base de données d’occurrences lexicales.

IV.3 Bases de données natives XML et NoSQL pour les textes semi-structurés

Face à la complexité et à l’hétérogénéité des textes anciens, les bases de données non relationnelles (NoSQL) et natives XML (eXist-db, BaseX) sont souvent plus adaptées. Ce sous-chapitre présente leur flexibilité, permettant de stocker et d’indexer directement des documents XML-TEI sans les “aplatir”. L’étudiant découvrira comment combiner la puissance de XQuery avec la performance d’un moteur de base de données pour des applications web philologiques dynamiques.

IV.4 Standardisation des métadonnées : Dublin Core et METS/MODS

Une description normalisée des ressources est la clé de leur découvrabilité et de leur partage. Ce point se concentre sur les schémas de métadonnées internationaux comme Dublin Core (pour la simplicité) et METS/MODS (pour la complexité). L’étudiant apprendra à créer des fiches descriptives pour des objets numériques (un manuscrit numérisé, un article) qui seront moissonnables par les moteurs de recherche et les portails spécialisés, assurant l’intégration du patrimoine congolais dans le web de données mondial.

Chapitre V. Visualisation de Données pour les Humanités Classiques

V.1 Principes sémiologiques de la visualisation d’information

Traduire la complexité textuelle en une représentation graphique efficace exige une connaissance des principes de la sémiologie graphique. Ce sous-chapitre explore la grammaire de la visualisation : comment choisir le bon type de graphique (barres, lignes, nuages de points) pour le bon type de données et le bon message. L’étudiant apprendra à éviter les biais visuels et à concevoir des visualisations qui éclairent l’analyse plutôt qu’elles ne l’obscurcissent, une compétence cruciale pour la communication scientifique.

V.2 Analyse de réseaux : cartographier les relations dans les textes latins

L’analyse de réseaux sociaux (SNA) permet de modéliser et de visualiser les relations entre entités. Appliquée aux textes latins, elle peut révéler les réseaux de personnages dans une pièce de Plaute, les correspondances entre intellectuels comme Cicéron et Atticus, ou les citations entre auteurs. L’étudiant apprendra, avec des outils comme Gephi, à transformer des données textuelles en graphes pour identifier les acteurs centraux, les communautés et les structures relationnelles cachées.

V.3 Visualisation spatio-temporelle : cartographie et frises chronologiques

Visualiser la dimension spatio-temporelle d’un récit ou d’un phénomène historique ancre l’analyse dans le concret. Ce segment aborde les outils de Systèmes d’Information Géographique (SIG) simples (comme Palladio) pour cartographier les lieux mentionnés dans les “Commentaires” de César ou les voyages de Saint Paul. Il explore aussi la création de frises chronologiques interactives pour suivre l’évolution d’un genre littéraire ou la vie d’un auteur, rendant l’information dense immédiatement intelligible.

V.4 Maîtrise des outils de visualisation : de l’esquisse à la publication

La maîtrise d’outils spécifiques est la condition de l’autonomie. Ce sous-chapitre est un tour d’horizon pratique des logiciels clés, allant des plus simples (RawGraphs pour des prototypes rapides) aux plus complexes (initiation à des librairies comme D3.js pour le web). L’objectif est que l’étudiant soit capable de produire une visualisation de qualité “publication”, exportable en haute résolution pour un article scientifique ou intégrable de manière interactive dans un site web de projet.

Chapitre VI. Conduite de Projet en Humanités Numériques

VI.1 Cycle de vie d’un projet numérique : de l’idée à la pérennisation

Structurer une démarche de recherche en mode projet est une compétence managériale fondamentale. Ce sous-chapitre détaille les phases du cycle de vie d’un projet en humanités numériques : idéation, planification (définition des objectifs, livrables, calendrier), exécution, dissémination et pérennisation. L’étudiant apprendra à rédiger une charte de projet, un document essentiel pour formaliser les ambitions et les moyens d’un projet de valorisation du patrimoine pour un bailleur de fonds ou une institution.

VI.2 Recherche de financements et rédaction de propositions de projet

La recherche de financements est le nerf de la guerre pour les projets d’envergure. Ce segment fournit une méthodologie pour identifier les appels à projets pertinents (fondations, agences nationales et internationales) et pour rédiger une proposition convaincante. L’accent est mis sur la manière d’articuler l’innovation scientifique, l’impact socio-économique local (création de compétences en RDC) et la faisabilité technique pour maximiser les chances de succès.

VI.3 Aspects juridiques et éthiques : droit d’auteur, licences et données ouvertes

Naviguer dans le cadre juridique et éthique est une responsabilité incontournable. Ce point aborde les questions de droit d’auteur pour les textes et les images, la différence entre les licences de réutilisation (Creative Commons), et les enjeux de l’Open Data et de l’Open Science. L’étudiant sera sensibilisé à la nécessité de gérer les droits pour les sources utilisées et de choisir une licence appropriée pour les données qu’il produira, garantissant la légalité et l’impact de son travail.

VI.4 Projet de synthèse : création d’une mini-édition numérique critique

En guise de synthèse opérationnelle, l’étudiant réalisera, en groupe, un projet complet de mini-édition numérique. En choisissant un court texte latin (potentiellement issu du patrimoine congolais), il devra en assurer la transcription, l’encodage XML-TEI, la mise en ligne via une plateforme simple (ex: GitHub Pages), et la rédaction d’une notice scientifique. Cet exercice final valide l’acquisition de l’ensemble des compétences techniques et managériales de l’UE et constitue une pièce maîtresse pour son portfolio professionnel.

PARTIE 2 : Maîtrise des Outils Numériques pour la Philologie Latine

Chapitre V. Encodage et Structuration des Textes Anciens (TEI)

V.1 Fondements de la Text Encoding Initiative (TEI)

Fondée sur le langage XML, la TEI constitue le standard international pour la représentation numérique des textes en sciences humaines. Cet apprentissage ne vise pas la théorie, mais la maîtrise de son schéma de balisage pour encoder la structure, les variantes et les métadonnées d’un manuscrit. L’étudiant produira des fichiers interopérables, prêts pour l’analyse computationnelle et l’archivage pérenne, une compétence clé pour la numérisation des fonds documentaires congolais, qu’ils soient anciens ou administratifs.

V.2 Structuration de l’en-tête (TEI Header)

Essentielle pour la traçabilité et la crédibilité scientifique, la maîtrise du TEI Header est non-négociable. L’étudiant apprendra à documenter méticuleusement la source du texte, l’historique de l’encodage, les responsabilités éditoriales et les détails de publication. Cette rigueur est directement applicable à la création de catalogues numériques pour les bibliothèques et archives en RDC, garantissant la validité des sources et facilitant les échanges de données avec les institutions internationales.

V.3 Balisage sémantique et critique du corps de texte

Au-delà de la simple transcription, le balisage sémantique permet d’identifier les entités nommées (personnes, lieux), les phénomènes linguistiques et les appareils critiques. L’étudiant appliquera ces techniques pour créer une édition numérique savante d’un texte latin. Cette compétence est transférable à l’analyse de corpus juridiques ou de discours politiques congolais, où l’identification précise des acteurs et des concepts est un enjeu stratégique pour l’intelligence économique et la gouvernance.

V.4 Validation, Transformation (XSLT) et Publication Web

Face à la nécessité de l’interopérabilité, la validation d’un document TEI contre son schéma est une étape cruciale. L’étudiant utilisera ensuite les transformations XSLT pour générer automatiquement des sorties multiples (HTML pour le web, PDF pour l’impression) à partir d’une seule source encodée. Cette compétence technique permet de déployer rapidement des sites web d’éditions critiques ou des bases de données consultables, valorisant le patrimoine textuel de la RDC à l’échelle mondiale avec des moyens optimisés.

Chapitre VI. Analyse Quantitative et Stylométrie

VI.1 Principes de la linguistique de corpus et de la lexicométrie

Sous l’angle de l’analyse quantitative, un texte est un gisement de données. Ce module expose les méthodes de la lexicométrie pour extraire des fréquences de mots, des cooccurrences et des spécificités lexicales. L’étudiant apprendra à préparer et à “nettoyer” un corpus pour l’analyse statistique. Appliquée aux textes latins, cette méthode permet de dégager des tendances stylistiques objectives, une approche également pertinente pour analyser la communication institutionnelle en RDC.

VI.2 Outils logiciels pour l’analyse de texte (Stylo, Voyant Tools)

Une maîtrise des logiciels open-source comme R (package Stylo) ou des plateformes web comme Voyant Tools est un impératif opérationnel. L’étudiant sera formé à leur utilisation concrète pour mener des analyses factorielles, des classifications hiérarchiques et des modélisations de thèmes (topic modeling). Il pourra ainsi, par exemple, comparer le style de différents auteurs latins ou analyser l’évolution thématique des publications de la presse de Kinshasa sur une période donnée.

VI.3 Techniques d’attribution d’auteur et de datation

Confronté à des textes anonymes ou d’attribution douteuse, le philologue moderne déploie des techniques stylométriques. Ce sous-chapitre se concentre sur les méthodes statistiques (Delta de Burrows, Zeta) permettant de comparer le “signal” stylistique d’un texte inconnu à celui d’auteurs potentiels. Cette expertise, développée sur des cas latins, peut être mobilisée dans des contextes d’expertise légale ou historique pour l’authentification de documents en RDC.

VI.4 Visualisation des données textuelles et interprétation

La simple production de chiffres étant insuffisante, leur visualisation est un outil heuristique et communicationnel puissant. L’étudiant apprendra à générer et interpréter des graphiques pertinents : nuages de mots pondérés, dendrogrammes, réseaux sémantiques. Cette compétence permet de synthétiser des analyses complexes et de présenter des résultats percutants à des décideurs, qu’il s’agisse de défendre une thèse académique ou de présenter un rapport d’analyse média à un ministère congolais.

Chapitre VII. Bases de Données Textuelles et Corpus Numériques

VII.1 Conception et modélisation d’une base de données philologique

La conception d’une base de données textuelles relationnelle (SQL) ou non-relationnelle (NoSQL) est une compétence d’architecte de l’information. L’étudiant modélisera une structure de données capable d’accueillir des textes latins, leurs traductions, leurs métadonnées et leurs annotations. Ce savoir-faire est directement requis pour des postes de gestionnaire de fonds documentaires, notamment pour structurer les futures archives numériques nationales de la RDC.

VII.2 Interrogation avancée des corpus (SQL, XPath/XQuery)

L’interrogation efficace d’une base de données est la clé de son exploitation. L’étudiant formulera des requêtes complexes en SQL pour extraire des informations de bases de données relationnelles, et en XPath/XQuery pour interroger des corpus encodés en XML-TEI. Il pourra ainsi répondre à des questions de recherche précises, comme “trouver toutes les occurrences du subjonctif imparfait dans les discours de Cicéron”, une logique applicable à l’analyse de n’importe quel corpus structuré.

VII.3 Exploitation des corpus existants (PHI, Perseus, CLTK)

Une connaissance approfondie des grandes banques de données et bibliothèques logicielles (comme le Classical Language Toolkit – CLTK) est fondamentale pour ne pas réinventer la roue. L’étudiant apprendra à moissonner, interroger et intégrer les ressources de ces plateformes internationales dans ses propres recherches. Cette capacité à se connecter aux réseaux mondiaux du savoir est un levier de développement pour la recherche en RDC, permettant de pallier un accès parfois limité aux sources physiques.

VII.4 Constitution et annotation d’un corpus spécialisé

Dans la perspective de valoriser le patrimoine local, l’étudiant sera guidé dans la constitution d’un mini-corpus thématique. Le processus couvrira la collecte et la numérisation des textes, leur annotation (linguistique, sémantique) et leur documentation. L’objectif est de créer une ressource à haute valeur ajoutée, par exemple un corpus des inscriptions latines découvertes en Afrique du Nord, préfigurant la création de corpus de langues congolaises pour le traitement automatique des langues (TAL).

Chapitre VIII. Anglais Scientifique : Lecture et Compréhension de la Recherche Philologique

VIII.1 Stratégies de lecture rapide et sélective (Skimming & Scanning)

Face au volume croissant des publications internationales, la capacité à évaluer rapidement la pertinence d’un article est une compétence de survie académique. L’étudiant apprendra les techniques de skimming (lecture en diagonale pour l’idée générale) et de scanning (recherche d’informations spécifiques) appliquées à des articles de philologie numérique. Cela lui permettra de constituer une bibliographie pertinente pour un projet de recherche en un temps record.

VIII.2 Acquisition du vocabulaire technique et des tournures idiomatiques

L’acquisition d’un lexique spécialisé en anglais (ex: tokenization, lemmatization, scholarly edition) est un prérequis. Ce module se focalise sur l’analyse de textes authentiques pour identifier et mémoriser le vocabulaire et les structures de phrases récurrentes dans le discours scientifique anglo-saxon. Cette maîtrise assure une compréhension fine des nuances et évite les contresens, cruciaux lors de l’étude de méthodologies complexes pour des projets en RDC.

VIII.3 Déconstruction de l’argumentation et identification des thèses

Déconstruire la structure argumentative d’un article de recherche est une forme de lecture critique. L’étudiant s’entraînera à identifier la problématique, l’hypothèse, la méthodologie, les résultats et la conclusion (structure IMRaD). Cette analyse structurelle permet de juger de la solidité d’une recherche et d’isoler les contributions théoriques ou méthodologiques réutilisables dans le contexte de la recherche congolaise, en adaptant les approches internationales aux réalités locales.

VIII.4 Synthèse et revue critique de la littérature

Au-delà de la compréhension, l’évaluation critique d’un article est la marque d’un esprit scientifique aguerri. L’étudiant apprendra à rédiger des fiches de lecture analytiques et des revues critiques courtes, en comparant les approches de différents auteurs sur un même sujet. Cette compétence est indispensable pour rédiger l’état de l’art d’un mémoire ou d’une thèse, et pour positionner sa propre recherche par rapport au champ académique international depuis la RDC.

Chapitre IX. Communication Académique en Anglais : Rédaction et Présentation

IX.1 Rédaction de l’abstract et des mots-clés

Condenser une recherche complexe en un abstract percutant de 250 mots est un exercice de haute précision. L’étudiant apprendra la structure canonique de l’abstract et l’art de choisir des mots-clés qui garantiront la visibilité de son travail dans les bases de données internationales. C’est la première étape pour qu’un chercheur basé à Kinshasa ou à Lubumbashi puisse attirer l’attention de la communauté scientifique mondiale sur ses travaux.

IX.2 Structuration et rédaction d’un article de recherche court

Respectant les standards IMRaD (Introduction, Methods, Results, and Discussion), l’étudiant sera guidé dans la rédaction d’un court article scientifique en anglais. L’accent sera mis sur la clarté, la concision et l’utilisation correcte des conventions académiques (citations, bibliographie). Cette compétence est la porte d’entrée vers la publication dans des revues internationales, un critère majeur pour l’avancement de carrière et le rayonnement des universités congolaises.

IX.3 Préparation et exécution d’une présentation orale (conférence)

La soutenance orale d’un projet de recherche en anglais requiert des compétences spécifiques : structuration du discours, conception d’un support visuel efficace (diaporama) et gestion des questions-réponses. L’étudiant se préparera à présenter ses travaux de philologie numérique lors de simulations de conférences. Cette formation est essentielle pour participer à des colloques internationaux et y défendre les intérêts de la recherche menée en RDC.

IX.4 Initiation à la rédaction de propositions de financement (Grant Proposal)

La capacité à rédiger une proposition de financement en anglais est une compétence à très haute valeur ajoutée socio-économique. Ce module initie à la structure d’une demande de subvention : définition du problème, objectifs, méthodologie, budget, livrables. Savoir “vendre” un projet de recherche, comme la numérisation d’un fonds d’archives à Goma, à des bailleurs internationaux (UNESCO, A. W. Mellon Foundation) est un levier de financement direct pour la culture et la science en RDC.

Chapitre X. Projet de Philologie Numérique Appliquée

X.1 Définition de la problématique et cahier des charges

Partant d’une problématique concrète, l’étudiant définira le périmètre d’un projet de philologie numérique de A à Z. Il devra rédiger un cahier des charges précis incluant les objectifs, le corpus choisi, les outils envisagés et un calendrier de réalisation. Ce projet pourra porter sur un texte latin ou, en guise de transposition, sur un corpus de textes congolais (par exemple, les éditoriaux du journal L’Éveil de la Nation de 1960).

X.2 Constitution du corpus et mise en œuvre de l’encodage

La constitution d’un corpus numérique primaire est le cœur du projet. L’étudiant devra collecter, numériser (si nécessaire) et transcrire ses textes sources. Il appliquera ensuite les principes de l’encodage TEI vus au Chapitre V pour structurer son corpus de manière rigoureuse. Cette phase pratique ancre définitivement les compétences techniques dans un processus de production concret, simulant les conditions d’un projet de numérisation professionnel.

X.3 Déploiement de la chaîne d’analyse et interprétation des résultats

L’articulation d’une chaîne de traitement est une compétence d’ingénieur. L’étudiant choisira et appliquera les outils d’analyse quantitative (Chapitre VI) pertinents pour sa problématique. Il devra ensuite interpréter les données brutes (statistiques, graphiques) pour en extraire du sens et répondre à sa question de recherche initiale, démontrant sa capacité à passer de la donnée technique à l’argumentation scientifique.

X.4 Valorisation et dissémination des résultats

La valorisation finale des résultats est l’aboutissement du projet. L’étudiant devra produire deux livrables : une édition web simple de son corpus (via XSLT) et un article de 4 pages en anglais (selon les normes du Chapitre IX) synthétisant sa démarche et ses conclusions. Ce livrable final constitue une preuve tangible et immédiatement valorisable de sa maîtrise de l’ensemble des compétences de l’UE, un véritable portfolio pour sa future carrière.

ANNEXES

A. Lexique bilingue (Anglais-Français) de la philologie numérique

Indispensable passerelle terminologique, ce lexique fournit la traduction et la définition contextualisée des concepts clés de la philologie numérique et des humanités digitales, majoritairement formulés en anglais. Il outille l’étudiant pour la lecture de documentations logicielles (AntConc, Stylo), la participation aux forums scientifiques internationaux et la rédaction d’articles. Sa maîtrise est une condition sine qua non pour l’intégration du chercheur congolais dans les réseaux de recherche mondiaux et la valorisation de ses travaux.

B. Vade-mecum des logiciels et plateformes open-source

Face à la barrière des coûts logiciels, ce guide pratique recense et évalue une sélection rigoureuse d’outils gratuits et performants pour l’analyse textuelle. De la création de concordances avec AntConc à l’analyse stylométrique avec Stylo (R), en passant par la détection d’intertextualité via Tesse-rae, chaque ressource est présentée avec son cas d’usage précis. L’objectif est de doter le futur philologue congolais d’un laboratoire numérique fonctionnel, autonome et sans frais de licence.

C. Répertoire critique des corpus textuels latins en ligne

Véritable cartographie des gisements de données, ce répertoire ne se contente pas de lister les grandes bibliothèques numériques (Perseus Digital Library, The Latin Library, Corpus Corporum). Il les évalue de manière critique selon la fiabilité des éditions, l’étendue de la couverture chronologique et la nature des licences d’utilisation. Cet outil stratégique permet à l’étudiant basé en RDC de localiser rapidement les sources primaires fiables pour ses recherches, garantissant une rigueur scientifique de niveau international.

D. Protocole d’encodage TEI-XML pour les manuscrits latins

Fondé sur les standards de la Text Encoding Initiative (TEI), ce protocole offre une méthode normalisée pour la transcription et le balisage sémantique de textes latins. Il détaille la structuration de l’en-tête (métadonnées), le balisage des divisions structurelles et l’annotation de l’apparat critique. L’application de ce protocole est la compétence technique fondamentale pour la création d’éditions numériques savantes, ouvrant la voie à la valorisation du patrimoine manuscrit conservé en RDC.

Discussion (0)

Aucune intervention pour le moment. Soyez le premier à contribuer.

Outils de Base en Lettres et Arts : Informatique, Anglais et Textes Anciens