La révolution numérique des manuscrits juifs médiévaux

  • Un projet international promeut la transcription automatique de centaines de milliers de manuscrits juifs médiévaux, avec la Guenizah du Caire comme principal site d'étude.
  • La Bibliothèque nationale d'Israël et la plateforme Ktiv pilotent la numérisation et la publication ouverte des textes, avec le soutien financier du Conseil européen de la recherche.
  • L'initiative MiDRASH associe l'intelligence artificielle et les sciences humaines pour reconstituer la culture littéraire juive médiévale et faciliter de nouvelles études universitaires.
  • Les séances de transcription et de révision collaboratives permettent d'améliorer les modèles d'IA et d'ouvrir les archives aux chercheurs et au public du monde entier.

manuscrits juifs médiévaux

L'immense collection de manuscrits juifs médiévaux La Guenizah du Caire, comme on l'appelle, vit actuellement un tournant décisif grâce à l'intelligence artificielle. Après des décennies où seule une petite partie des documents était facilement accessible, la combinaison de… numérisation de masse Et les systèmes de reconnaissance de texte commencent véritablement à ouvrir ces archives uniques aux chercheurs et au grand public.

Ce qui, jusqu'à récemment, semblait un rêve pour les philologues et les historiens — la possibilité de rechercher, lire et comparer L'idée de rendre accessibles des centaines de milliers de fragments hébraïques médiévaux depuis n'importe quel ordinateur est devenue un projet concret. Grâce à la plateforme Ktiv de la Bibliothèque nationale d'Israël et au programme MiDRASH, des transcriptions préliminaires de la quasi-totalité des fragments de la Genizah ont été réalisées, et les préparatifs sont en cours pour leur révision, leur amélioration et leur publication en libre accès.

Des archives médiévales gigantesques, enfin lisibles

collection de manuscrits juifs médiévaux

L'appel Genizah du Caire Elle est considérée comme la collection de documents juifs médiévaux la plus vaste et la plus diversifiée au monde. Pendant près de mille ans, la communauté juive de la capitale égyptienne y a déposé des textes religieux, juridiques, commerciaux et littéraires qui, en raison de la tradition interdisant la destruction des écrits au nom de Dieu, ne pouvaient être simplement jetés. Il en a résulté une collection dont le nombre est aujourd'hui estimé à environ [nombre manquant]. 400.000 fragments, préservés en grande partie grâce au climat sec de l'Égypte.

Malgré son importance, la collection n'a été que partiellement exploitée : jusqu'à récemment, moins d'un tiers des documents étaient catalogués et à peine… 10 à 15 % avaient un relevé de notes Lisible. Le reste, bien que numérisé et accessible sous forme d'image, demeurait difficile à traiter systématiquement, car la lecture de manuscrits hébraïques médiévaux en écriture cursive ou semi-cursive exige beaucoup d'expérience et de temps.

La nouvelle phase du projet modifie ce paysage. S'appuyant sur l'infrastructure de Ktiv — la base de données numérique de tous les manuscrits hébraïques connus, gérée par la Bibliothèque nationale d'Israël —, une équipe internationale a développé systèmes de transcription automatique capable de convertir ces fragments en texte numérique consultable, du moins dans une première version qui sera ensuite affinée.

Selon les données publiées par l'institution, des transcriptions préliminaires ont déjà été générées pour la quasi-totalité des éléments de la Genizah du Caire, en plus de des milliers de manuscrits hébreux supplémentaires Ces collections proviennent d'autres collections médiévales. Pour un domaine qui travaillait pièce par pièce depuis plus d'un siècle, le bond en avant est considérable.

MiDRASH : L’IA et les sciences humaines au service des manuscrits hébraïques

Au cœur de cette transformation se trouve MiDRASH (Migrations des traditions textuelles et scribales via l'analyse informatique à grande échelle de manuscrits médiévaux en écriture hébraïque), un projet interdisciplinaire qui réunit des spécialistes d'Israël et d'Europe. Cette initiative a débuté en 2023 grâce à une subvention ERC Synergy de 10 millions d'euros octroyée par le Conseil européen de la recherche pour une durée de six ans ; il s'agit de la première subvention de ce type spécifiquement dédiée aux études juives.

L’objectif de MiDRASH ne se limite pas à la simple transcription de textes anciens. Comme l’explique l’un de ses directeurs, le professeur Daniel Stökl Ben Ezra, l’ambition est… Reconstituer la culture littéraire juive médiévale du livre, en retraçant quels auteurs citent d'autres auteurs, comment les commentaires rabbiniques (midrashim) circulent entre les communautés musulmanes et chrétiennes, ou comment les traditions écrites sont transformées au fil des siècles.

Pour ce faire, l'équipe a choisi de travailler au sein d'une plateforme open source. ScriptoriumConçu pour la transcription automatique de manuscrits et d'inscriptions, ce système développe des modèles spécifiques pour l'écriture hébraïque médiévale, entraînés sur des milliers de transcriptions compilées manuellement par des spécialistes pendant de nombreuses années. Il en résulte un système capable de segmenter les lignes et les mots dans des images anciennes et de les convertir en texte modifiable.

Les responsables soulignent que, bien que les transcriptions initiales contiennent des erreurs — inévitables avec une écriture irrégulière, des fragments manquants ou des encres délavées —, leurs utilité pratique C'est un outil formidable : il permet de localiser rapidement des passages bibliques, des sections du Talmud, des lettres, des contrats ou des textes liturgiques, ce qui nécessitait auparavant une lecture patiente page par page.

Des microfilms aux plateformes ouvertes : un long chemin

numérisation des manuscrits juifs médiévaux

La révolution numérique actuelle manuscrits juifs médiévaux Elle n'est pas apparue ex nihilo. La Bibliothèque nationale d'Israël elle-même rappelle que dès 1950, sous l'impulsion du Premier ministre David Ben Gourion, l'Institut des manuscrits hébraïques microfilmés fut créé. Le transfert physique de toutes les collections à Jérusalem étant irréalisable, la solution retenue fut de photographier le plus grand nombre possible de collections sur microfilm, jetant ainsi les bases d'un vaste fonds d'archives visuelles.

Au fil des décennies, certaines ont été incorporées Collections 1.500 À partir de 2006, les documents de la Genizah du Caire, provenant de diverses sources, ont été intégrés au projet Friedberg Geniza, ce qui a accéléré leur numérisation systématique. En 2014, la Bibliothèque nationale a entrepris la conversion de ses archives photographiques en une collection numérique accessible en ligne, permettant ainsi à tout utilisateur, pour la première fois, de consulter des milliers de manuscrits hébraïques sur Internet.

MiDRASH s'appuie directement sur ces travaux antérieurs. Utilisant l'infrastructure de Ktiv — qui a déjà regroupé la plupart des manuscrits hébreux connus dans une base de données unique —, l'équipe emploie des algorithmes de apprentissage automatique L’objectif est d’identifier les lettres, les mots et les structures textuelles. Cette combinaison d’archives centralisées et d’outils informatiques avancés permet de s’affranchir d’un problème majeur rencontré dans d’autres domaines, comme l’étude des manuscrits arabes, où le matériel est beaucoup plus dispersé.

Le Dr Tsafra Siew, responsable des projets de recherche à la Bibliothèque nationale, qualifie MiDRASH de véritable point d'inflexion Pour tous ceux qui travaillent sur des manuscrits hébraïques médiévaux. Selon lui, ce progrès considérable ne se limite pas à faciliter l'accès à ces documents, mais permet également d'effectuer des analyses qui, de par leur ampleur, étaient impossibles lorsque chaque document devait être lu manuellement et presque individuellement.

Ateliers internationaux de collaboration et de transcription

Le projet MiDRASH fonctionne comme un consortium international alliant expertise technique et sciences humaines. Parmi les chercheurs principaux figurent le professeur Nachum Dershowitz (Université de Tel Aviv), le docteur Avi Shmidman (Université Bar-Ilan) et la professeure Judith Olszowy-Schlanger (Université d'Oxford), ainsi que des équipes de l'Université de Haïfa, de la Bibliothèque nationale d'Israël et de l'Institut national de la recherche scientifique et technologique (INRS). Projet Princeton Geniza, sous la direction du professeur Marina Rustow.

Loin de se limiter aux travaux de laboratoire, cette initiative ouvre également la voie à la participation du public. Du 24 au 27 novembre, un événement d'envergure a été organisé à Jérusalem, avec une retransmission en ligne. « Marathon de transcription » Ce projet porte sur les manuscrits hébraïques médiévaux et modernes en écriture cursive et semi-cursive. Lors de ces sessions, des bénévoles formés examinent et corrigent les transcriptions générées par l'IA.

Cette approche collaborative poursuit un double objectif. D'une part, améliorer qualité et précision D’une part, les textes eux-mêmes sont analysés ; d’autre part, des corrections humaines permettent d’affiner les modèles de reconnaissance, afin de réduire le nombre d’erreurs et d’améliorer la reconnaissance des écritures les plus problématiques. L’idée est que le système apprenne progressivement de l’expérience accumulée par les philologues, les paléographes et les spécialistes de l’hébreu.

La Bibliothèque nationale d'Israël a indiqué que les transcriptions définitives de la Genizah du Caire seront intégrées à Ktiv et mises à la disposition du public avec les images originales de chaque manuscrit. De cette manière, tout chercheur peut comparer ce que la machine voit avec ce qui est visible sur le fac-similé, préservant ainsi la transparence et permettant de nouvelles lectures ou des corrections ultérieures.

De nouvelles questions pour une vieille histoire

Une fois la phase de transcription massive achevée, les responsables du projet ambitionnent d'aller bien au-delà du simple accès. L'objectif est de pouvoir réaliser analyse linguistique et textuelle à grande échelle : détecter des chaînes de citations, identifier des paraphrases, reconstituer des itinéraires d’idées ou suivre l’évolution de certains motifs théologiques et juridiques à travers les siècles.

En pratique, cela signifie que les manuscrits juifs médiévaux cessent d'être de simples pièces isolées sur des étagères ou dans des archives numériques et commencent à fonctionner comme un réseau interconnecté de textesL'IA aide à repérer les schémas, les similitudes et les récurrences qui passeraient inaperçus lors d'une lecture purement individuelle, tandis que les spécialistes fournissent le contexte historique et philologique nécessaire pour interpréter la signification de ces liens.

L'équipe s'intéresse notamment à retracer l'évolution des midrashim, ces récits et commentaires rabbiniques qui circulaient au sein des communautés juives en territoires musulmans et chrétiens. Cartographier les variations d'un même texte selon les régions ou les époques ouvre la voie à une meilleure compréhension de… contacts culturels, les conflits internes et les réinterprétations doctrinales qui ont eu lieu au Moyen Âge.

Les chercheurs insistent sur le fait que la transcription automatique, malgré ses imperfections, n'est qu'un point de départ. Des développements ultérieurs seront possibles à partir de cette base. études comparatives Le vocabulaire, la syntaxe ou les styles d'écriture, mais aussi les analyses socio-économiques fondées sur des lettres, des contrats commerciaux ou des documents juridiques qui, jusqu'à présent, avaient été à peine explorés de manière systématique.

Impact mondial et opportunités pour l'Europe

Bien que le projet ait été initié et soit coordonné depuis Israël, ses effets s'étendent pleinement à la communauté universitaire européenne. La subvention ERC Synergy qui finance MiDRASH s'inscrit dans le cadre de la politique de l'Union européenne en matière de… Les infrastructures numériques de soutien aux infrastructures numériques sont essentielles. pour les sciences humaines, et plusieurs des principaux chercheurs travaillent dans des universités en France, au Royaume-Uni et dans d'autres pays.

Pour les spécialistes européens de l'histoire méditerranéenne, du judaïsme médiéval ou de l'islam classique, la mise en place d'une base de données aussi complète et interrogeable représente un changement majeur. Jusqu'à présent, la reconstitution de la vie des communautés juives vivant en territoires musulmans – y compris là où résidaient les musulmans – constituait une entreprise complexe. 90% de la population juive médiévale— Cela impliquait des déplacements et un accès restreint aux archives. Avec l'ouverture progressive de Ktiv, une grande partie de ces documents devient accessible depuis n'importe quel campus ou centre de recherche.

De plus, la méthodologie développée dans le cadre de MiDRASH offre un modèle qui peut être étendu à d'autres collections documentaires européennes : des collections de manuscrits latins aux archives notariales ou ecclésiastiques. L'idée de combiner numérisation, transcription automatique et collaboration publique s'impose comme une solution prometteuse. itinéraire reproductible préserver et étudier d'autres sites patrimoniaux menacés de détérioration.

Les responsables du projet sont convaincus que la publication des résultats dans des revues scientifiques à comité de lecture permettra de consolider cette approche conformément aux normes académiques. Parallèlement, libre accès Les images et les transcriptions promettent de faciliter la collaboration entre les universités d'Israël, d'Europe et d'Amérique, générant ainsi des réseaux de recherche plus vastes autour des manuscrits juifs médiévaux.

Le développement de l'intelligence artificielle appliquée à la Guenizah du Caire et à d'autres manuscrits hébraïques transforme des archives quasi ingérables en un source vivante et en expansionCe qui exigeait autrefois des années de lecture méticuleuse peut désormais être retracé en quelques secondes, sans pour autant diminuer l'importance du travail d'experts, mais bien au contraire : cela libère du temps pour poser des questions plus complexes et interpréter en profondeur un patrimoine qui, petit à petit, cesse d'être un trésor caché et devient une ressource partagée à l'échelle mondiale.

manuscrits-0
Article connexe:
Nouvelles découvertes et technologies dans l'étude des manuscrits historiques