Questo sito utilizza cookie per migliorare la tua esperienza di navigazione e rispetta la tua privacy in ottemperanza al Regolamento UE 2016/679 (GDPR)

                                                                                                             

×

Attenzione

JUser: :_load: non è stato possibile caricare l'utente con ID: 677

L'incontro di due mondi opposti: l'intelligenza artificiale entra nell'Archivio segreto Vaticano

Uno degli archivi più vasti del mondo nascosto tra le mura vaticane, che ospita più di 85 chilometri di scaffali su cui sono riposti documenti che risalgono a circa dodici secoli fa: dalla bolla papale di scomunica di Martin Lutero, fino alle encicliche più note nel corso della storia, apre le sue porte non lontane dalla Cappella Sistina e la Biblioteca Apostolica, alla cosiddetta intelligenza artificiale.
La documentazione conservata nell’Archivio segreto Vaticano è consultabile solo da studiosi in grado di decifrarne le scritture, dal momento che solo una piccola parte dell’immenso patrimonio è stata scansionata e trasformata in formato digitale, ancora meno pagine sono state trascritte in testo informatico e rese disponibili per la ricerca.
Ed è qui che fa il suo ingresso un nuovo progetto, In Codice Ratio, che si propone di risolvere queste problematiche. Attraverso tecniche di analisi delle immagini digitali e d’intelligenza artificiale e software di riconoscimento ottico dei caratteri (ocr) si spera di poter analizzare testi così complessi e renderli fruibili, rendendo disponibile, per la prima volta, la loro trascrizione.
L’ocr tradizionale, divide le parole in una serie di immagini, ognuna costituita da un singolo carattere inclusi gli spazi, poi confronta ogni immagine con un archivio che ha in memoria, quetso approccio non sembrerebbe adatto per la scansione dei materiali contenuti nell’Archivio, perchè funzionale principalmente per i testi stampati, ma non per quelli scritti a mano, come la maggior parte degli antichi documenti manoscritti, nei quali molto spesso non compare lo spazio tra le lettere soprattutto se si usano tipologie di scrittura come la carolina.
In Codice Ratio ha introdotto una nuova modalità di riconoscimento ottico dei testi manoscritti.
I cinque coordinatori del progetto: Paolo Merialdo, Donatella Firmani, Elena Nieddu, Serena Ammirati dell’Università Roma Tre, e Marco Maiorino dell’Archivio segreto Vaticano utilizzano un’innovazione chiamata scomposizione a mosaico. Questo processo separa le parole non in lettere ma in segmenti più simili a tratti di penna: l’ocr divide ogni parola in una serie di strisce verticali e orizzontali, cercando le porzioni in cui sono presenti meno pixel, sulle quali poi il software incide le lettere in corrispondenza di queste giunzioni. Il risultato è una serie di tessere a mosaico che possono essere ricombinate in vari modi, individuando quali gruppi di tessere corrispondano a delle lettere e quali no. Grazie all’aiuto di esperti paleografi e di studenti chiamati da 24 scuole italiane, la macchina sta imparando a riconoscere quali siano i caratteri giusti, distinguendoli dai cosiddetti “falsi amici” e servendosi di dati statici estrapolati da un corpus di 1,5 milioni di testi latini in cui si è calcolata la frequenza delle sequenze composte da 3 a 5 lettere.
L’intento di tutto questo lavoro sarebbe quello di rendere disponibili lettere, diari, testi manoscritti ai ricercatori di tutto il mondo, semplificando sia la lettura di questi documenti, sia la ricerca di materiale realmente rilevante, ma non è certo un campo semplice su cui mettere mano, sorgono una serie di problematiche che i filologi e i paleografi delle epoche passate hanno dovuto affrontare senza l’aiuto di supporti informatici, forse la scienza riuscirà a stupirci e vincere ancora una volta la sua sfida con l’intelletto umano.

16/05/2018
Ilaria Costabile

Libro della settimana

Facebook

Formazione

Sentieri dell'arte

Digital COM