Modifié

L'IA pour déchiffrer des rouleaux carbonisés par l'éruption du Vésuve

Trois scientifiques, dont un Bâlois, ont percé le mystère des papyrus carbonisés avec l’aide de l’intelligence artificielle
Trois scientifiques, dont un Bâlois, ont percé le mystère des papyrus carbonisés avec l’aide de l’intelligence artificielle / 19h30 / 2 min. / le 8 février 2024
Trois chercheurs ont remporté un prix de 700'000 dollars pour avoir réussi à déchiffrer, grâce à l'intelligence artificielle, une petite partie de rouleaux manuscrits vieux de près de 2000 ans et gravement endommagés par l'éruption du Vésuve en 79 après J.C.

C'est une fabuleuse avancée pour l'archéologie et la connaissance de la culture de l'Antiquité, potentiellement une révolution: des textes gréco-romains ensevelis au premier siècle de notre ère, sous la boue et les cendres du Vésuve, vont enfin pouvoir être lus.

Les papyrus d'Herculanum consistent en quelque 800 rouleaux carbonisés lors de l'éruption qui a enseveli Pompéi et Herculanum. Deux cités vitrifiées dans le temps, remplies de trésors scientifiques inestimables.

Une partie des rouleaux carbonisés retrouvés à Herculanum, dans la Villa des papyrus. Plus de 600 sont complètement intacts, enroulés, scellés, et n'ont pas encore pu être lus. [University of Kentucky]

Ces précieux papyrus, qui ressemblent à des bûches calcinées, sont conservés à l'Institut de France à Paris, à la Bibliothèque nationale à Naples, à Londres et à Oxford, au Royaume-Uni. Les rouleaux s'effritent en particules cendrées et sont facilement endommagés lorsque l'on tente de les dérouler, risquant de les perdre à tout jamais, comme cela a déjà été malheureusement le cas depuis leur découverte en 1752.

A l'époque des premières fouilles, ils avaient même été identifiés comme des morceaux de bois ou des briquettes de charbon et mis au rebut avec d'autres détritus... ou ont servi de combustible!

Booster la recherche avec un concours

Pour en savoir plus, un concours a été lancé en mars 2023: nommé Vesuvius Challenge, il a été créé par Brent Seales, un chercheur en informatique à l'Université du Kentucky aux Etats-Unis, et Nat Friedman, fondateur de la plateforme Github, détenue désormais par Microsoft. Ce dernier a aidé à lever des fonds auprès de ses connaissances de la Silicon Valley pour financer les prix du défi, mettant aussi de l'argent de sa propre poche, passionné qu'il était par l'histoire des rouleaux indéchiffrés d'Herculanum.

Les organisateurs avaient réalisé au préalable des scans en haute résolution de quatre rouleaux et offraient une récompense totale d'un million de dollars pour qui déchiffrerait au moins 85% de quatre passages de 140 caractères avant la fin de l'année 2023. La clef du succès de ce concours a été son "mélange de compétition et de coopération", selon Nat Friedman, cité dans un article de Nature.

Des prix plus modestes ont été attribués en cours de route pour encourager les progrès; le code d'apprentissage automatique gagnant a été publié à chaque étape pour "faire passer au niveau supérieur" la communauté, afin que participantes et participants puissent s'appuyer sur les progrès des autres. Un clin d'œil aux racines open-source de Nat Friedman: l'entrepreneur a insisté sur le fait que les prix ne pouvaient être remportés que si les personnes concurrentes acceptaient de montrer au monde leurs procédés.

A noter qu'en 2016, Brent Seals et son équipe avaient marqué l'Histoire en réussissant à dérouler virtuellement le rouleau d'En-Gedi, écrit sur une peau animale, révélant ainsi qu'il s'agissait du Livre du Lévitique. Les scientifiques pensent que c'est l'un des textes bibliques hébraïques les plus vieux à avoir été trouvés ne faisant pas partie des fameux manuscrits de la mer Morte.

Carbone sur carbone

Problème majeur de l'aventure, l'encre utilisée sur les rouleaux d'Herculanum est à base de carbone et se trouve sur des papyrus ...carbonisés! Les rayons X sont presque incapables de la distinguer sur du papyrus, lui-même fait de carbone, à moins de travailler avec une très haute résolution. Un défi bien plus grand que des écrits apposés sur une peau, comme pour le texte d'En-Gedi.

Pour révéler l'encre, Brent Seales a utilisé la tomographie assistée par ordinateur: elle lui a permis de voir l'épaisseur laissée par le pigment – ressemblant à une craquelure sur de la boue sèche – sur la fibre végétale brûlée. La texture du papyrus et de l'encre sont également différentes et distinguables avec un microscope électronique à balayage et une haute résolution.

Dans ses recherches, le professeur a entraîné l'intelligence artificielle à voir où pouvait se trouver l'encre formant des lettres – caractères disponibles dans une bibliothèque de références – et à amplifier ses résultats avec le machine learning, soit l'apprentissage automatique.

La photographie d'un caractère, sa tomographie, l'apprentissage automatique et son amplification. [Getty Museum - Brent Seales]

Comparant ses recherches aux galaxies lointaines dénichées par le télescope Hubble dans l'Univers profond, Brent Seales explique: "C'est comme si l'on utilisait un télescope pour regarder à l'intérieur des rouleaux d'Herculanum, à la résolution dont nous avons besoin, pour voir le carbone de l'encre et procéder au déroulement virtuel des papyrus."

Le concours crée l'émulation scientifique et permet à d'autres cerveaux de se mettre ensemble pour trouver des solutions innovantes: "Cette compétition nous a permis de voir plus de mille équipes de recherche s'engager pour travailler sur un problème qui aurait normalement bénéficié du labeur de seulement cinq personnes", se réjouit le scientifique. Un coup de pouce bienvenu à la recherche: "La taille du corpus d'Herculanum sera la plus grande découverte de l'Antiquité au XXIe siècle", estime-t-il, rappelant que le XXe a lui eu celle des manuscrits de la mer Morte.

Détecter les répétitions

Le trio récompensé par le Grand Prix du Vesuvius Challenge est composé de Youssef Nader, un doctorant à Berlin, Luke Farritor, un étudiant et stagiaire de SpaceX originaire du Nebraska aux Etats-Unis, et Julian Schilliger, un étudiant suisse en robotique à l'EPFZ. Ils se partageront la somme de 700'000 dollars.

Ils ont notamment utilisé leurs algorithmes d'intelligence artificielle pour distinguer l'encre du papyrus et ont déterminé la nature des caractères grecs en détectant les répétitions. Grâce à cette technique, Luke Farritor, 21 ans, avait été le premier à déchiffrer le premier mot d'un passage: ΠΟΡΦΥΡΑϹ, porphyras, soit "violet" en grec ancien, un terme qui n'apparaît pas souvent dans la littérature connue.

ΠΟΡΦΥΡΑϹ, porphyras, soit "violet" en grec ancien, sur un bout de papyrus enroulé de 4 centimètres carrés. [Vesuvius Challenge]

Unissant leurs efforts, les trois chercheurs ont désormais déchiffré environ 5% d'un rouleau, selon les organisateurs: des centaines de mots sur plus de quinze colonnes. Le texte révélé évoque des sources de plaisir telles que la musique, le goût des câpres et la couleur violette.

Les résultats sont "incroyables", estime Federica Nicolardi, papyrologue à l'Université de Naples Federico II, dans une vidéo de la National Science Foundation: "Nous avons tous été complètement stupéfaits par les images qu'ils ont montrées". Elle et ses collègues s'empressent désormais d'analyser le texte révélé.

>> Animation montrant la détection de petites fenêtres comportant ou non de l'encre: Les modèles de détection ne sont pas basés sur des lettres grecques, la reconnaissance optique de caractères ou des modèles linguistiques. Ils détectent indépendamment de minuscules taches d'encre dans le scanner: l'écriture apparaît plus tard, lorsque ces taches sont regroupées. Par conséquent, le texte révélé sur les images n'est pas le résultat imaginé d'un modèle d'apprentissage automatique, mais est directement lié aux données sous-jacentes du tomodensitogramme:

Détection d'encre sur papyrus carbonisé
Détection d'encre sur papyrus carbonisé / L'actu en vidéo / 15 sec. / le 7 février 2024

Pour Nat Friedman, l'auteur est "probablement le philosophe épicurien Philodemus", aussi appelé Philodème de Gadara, qui écrivait "à propos de nourriture, de musique, et de comment profiter des plaisirs de la vie". Ce disciple d'Epicure était vraisemblablement le philosophe-en-résidence de la Villa et devait travailler dans la petite bibliothèque où les rouleaux ont été découverts, à environ cinquante mètres sous terre.

>> Le rouleau scanné, déchiffré et reconstitué lors du Vesuvius Challenge:

Ce texte n'a pas été vu depuis 2000 ans! Il reste en gros 95% du rouleau à déchiffrer. [Vesuvius Challenge]

Une bibliothèque unique

Certaines historiennes et historiens estiment que ces documents ont appartenu un temps au sénateur romain et consul Lucius Calpurnius Piso Caesoninus, père de Calpurnia, la dernière des épouses de Jules César. Un homme riche et éduqué qui devait vraisemblablement avoir en sa possession des classiques de son époque, ainsi que des œuvres plus modernes. Pison, comme il est souvent appelé, est notamment connu pour avoir souvent correspondu avec l'homme d'Etat Cicéron.

Une reconstitution d'artiste de la Villa des papyrus à Herculanum [Vesuvius Challenge - Rocío Espín Piñar]

La "Villa des papyrus", où ont été retrouvés au XVIIIe siècle les rouleaux, est toujours en majorité enfouie et pourrait contenir plusieurs milliers – voire dizaines de milliers – d'autres manuscrits: il s'agit même de l'unique bibliothèque à avoir survécu de toute l'Antiquité. Elle contiendrait nombre de pépites gréco-romaines en poésie, pièces de théâtre et philosophie: les œuvres d'Eschyle, de Sappho et de Sophocle figurent en bonne place sur la liste de souhaits des scientifiques. Certaines personnes affirment qu'il est facile d'imaginer de nouvelles révélations sur les premières années du christianisme.

"Certains de ces textes pourraient complètement réécrire l'histoire de périodes clefs du monde antique", a estimé Robert Fowler, chercheur en études classiques et président de la Herculaneum Society, auprès du magazine Bloomberg Businessweek.

Le déchiffrage de ces textes pourrait en effet représenter une percée majeure: selon un inventaire de l'Université de Californie à Irvine, seuls 3 à 5% des textes de grec ancien auraient survécu jusqu'à l'ère moderne. Désormais, nombre de textes abandonnés vont pouvoir renaître grâce à cette technologie, comme des écrits cachés dans le cartonnage des momies égyptiennes: celui-ci était fréquemment constitué de papyrus recyclés.

Nat Friedman a annoncé une nouvelle série de prix pour le Vesuvius Challenge 2024, avec pour objectif de lire 90% des rouleaux 1 à 4 d'ici la fin de l'année. En attendant, le simple fait d'être arrivé jusqu'ici "tient du miracle", dit-il dans Nature: "Je n'arrive pas à croire que cela ait fonctionné". Sur le réseau social X, il annonce vouloir fouiller toute la Villa: "Que Dieu me vienne en aide", ajoute-t-il.

>> Lire aussi : Et si l'intelligence artificielle nous permettait de communiquer avec les animaux?

Stéphanie Jaquet et l'afp

Publié Modifié

Le plaisir, le bien suprême dans la philosophie épicurienne

Le Vesuvius Challenge explique que le sujet général du texte est "le plaisir qui, bien compris, est le bien suprême dans la philosophie épicurienne. Dans deux extraits de deux colonnes consécutives du rouleau, l'auteur se demande si et comment la disponibilité des biens, tels que la nourriture, peut affecter le plaisir qu'ils procurent".

Les choses disponibles en moindre quantité procurent-elles plus de plaisir que celles qui sont disponibles en abondance? L'auteur répond par la négative: "Comme dans le cas de la nourriture, nous ne croyons pas d'emblée que les choses rares sont absolument plus agréables que celles qui sont abondantes. Cependant, est-il naturellement plus facile pour nous de nous passer des choses qui sont abondantes?" Et il ajoute: "Ces questions seront fréquemment examinées".

>> La fin du rouleau attribué à Philodème de Gadara:

"... car nous ne nous interdisons pas de mettre en doute certaines choses, mais d'en comprendre et d'en retenir d'autres. Et qu'il nous soit évident de dire des choses vraies, comme elles ont pu souvent paraître évidentes!" [Vesuvius Challenge]

Comme il s'agit de la fin d'un rouleau, cette formulation peut suggérer que d'autres textes sont à venir dans les livres suivants du même ouvrage. Au début du premier texte, un certain Xenophantos est mentionné, peut-être le même homme – vraisemblablement un musicien joueur de flûte – également mentionné par Philodème dans son ouvrage "Sur la musique".