E-Cheikho : la renaissance numérique des textes arabes chrétiens

Vendredi 26 avril 2024

Dans son objectif visant à accompagner la technologie, le Centre de documentation et de recherches arabes chrétiennes (CEDRAC) vient de lancer la base de données e-Cheikho pour la préservation du patrimoine littéraire arabe chrétien.

Durant le mois d’avril 2024, le Centre de documentation et de recherches arabes chrétiennes (CEDRAC) de l'Université Saint-Joseph de Beyrouth a franchi une étape décisive en signant une convention avec le Groupe de recherche Emmy Noether « Conflits religieux et mobilité, 700-900 » de l’Université de Tübingen en Allemagne. L'objet principal de cette collaboration est la base de données e-Cheikho dédiée à la sauvegarde des textes arabes chrétiens sous format numérique.

En effet, depuis 2019, le CEDRAC œuvre avec détermination à développer une base de données exhaustive pour préserver le riche patrimoine culturel de la littérature arabe chrétienne, depuis ses débuts, au VIIIe siècle, jusqu'au XIXe siècle. Baptisée e-Cheikho en hommage au P. Louis Cheikho s.j. (1859-1927), éminent chercheur des études chrétiennes orientales à Beyrouth, cette plateforme repose sur les travaux novateurs de Georg Graf, Joseph Nasrallah, David Thomas et Camille Hechaimé s.j., entre autres. Conçue pour offrir aux chercheurs et aux passionnés des aperçus précieux sur ce domaine d'étude, e-Cheikho propose non seulement des textes numérisés entièrement interrogeables, mais également des informations actualisées sur les auteurs, les œuvres et les manuscrits.

Au cours des quatre dernières années, l'équipe du projet a investi des efforts considérables dans la recherche et les tests de la base de données. La première phase a impliqué le catalogage d'un groupe diversifié de 150 auteurs et 450 textes, englobant différentes confessions et totalisant 8,5 millions de mots de différentes époques. Désormais, les chercheurs disposent d'un outil robuste pour enrichir leur exploration de la littérature arabe chrétienne. Deux autres étapes sont prévues : l’intégration des œuvres arabes des jésuites et le corpus des débats sur l’union entre les Rūms et Rome (DURR).

Alors que le projet avance, l'équipe entame une nouvelle phase axée sur l'analyse exhaustive de tous les mots de la base de données. Cette étape vise à améliorer l'utilisabilité, notamment pour les linguistes intéressés par les subtilités de l'usage de la langue arabe. Pour atteindre cet objectif, l'Université de Tübingen met en avant son expertise et ses ressources, avec une collaboration informelle avec l'Université catholique de Louvain-la-Neuve. L'intégration de l'intelligence artificielle (IA) offre une promesse considérable, étant donné le vaste corpus disponible pour former des modèles d'IA.

Cette collaboration met en lumière l'engagement du CEDRAC et de l'Université de Tübingen envers l'adoption des avancées technologiques, garantissant ainsi la préservation et l'accessibilité du patrimoine culturel tout en faisant progresser les méthodologies de recherche contemporaines. Les résultats attendus ont le potentiel non seulement de contribuer de manière significative à la compréhension et à l'appréciation de la littérature arabe chrétienne, mais également de révolutionner la recherche linguistique dans son ensemble.