banner
Centro notizie
Eccezionale competenza nel loro mestiere.

Un umano

Apr 10, 2023

Rapporti scientifici volume 13, numero articolo: 8699 (2023) Citare questo articolo

903 accessi

1 Altmetrico

Dettagli sulle metriche

Questo articolo illustra i risultati ottenuti utilizzando modelli di deep learning di segmentazione semantica pre-addestrati per il rilevamento di siti archeologici all'interno dell'ambiente delle pianure alluvionali mesopotamiche. I modelli sono stati perfezionati utilizzando immagini satellitari liberamente disponibili e forme vettoriali provenienti da un ampio corpus di annotazioni (ovvero, siti esaminati). Un test randomizzato ha dimostrato che il modello migliore raggiunge una precisione di rilevamento prossima all'80%. L’integrazione delle competenze del settore è stata fondamentale per definire come costruire il set di dati e come valutare le previsioni, poiché definire se una maschera proposta conta come previsione è molto soggettivo. Inoltre, anche una previsione imprecisa può essere utile se contestualizzata e interpretata da un archeologo esperto. Partendo da queste considerazioni chiudiamo il documento con una visione per un flusso di lavoro di collaborazione uomo-intelligenza artificiale. Partendo da un set di dati annotato che viene perfezionato dall'esperto umano, otteniamo un modello le cui previsioni possono essere combinate per creare una mappa termica, da sovrapporre a immagini satellitari e/o aeree, o in alternativa possono essere vettorializzate per effettuare ulteriori analisi in un GIS software più semplice ed automatico. A loro volta, gli archeologi possono analizzare le previsioni, organizzare le indagini in loco e perfezionare il set di dati con annotazioni nuove e corrette.

Questo articolo documenta i risultati di una collaborazione tra data scientist e archeologi con l'obiettivo di creare un sistema di intelligenza artificiale (AI) in grado di assistere nel compito di rilevare potenziali siti archeologici da immagini aeree o, nel nostro caso, satellitari. L'utilizzo di modelli di segmentazione semantica ci ha permesso di tracciare contorni precisi e la valutazione human-in-the-loop ha mostrato che l'accuratezza del rilevamento è prossima all'80%.

Questa procedura rientra nell'ambito del Remote Sensing (RS) che indica l'atto di rilevare e/o monitorare a distanza un punto di interesse. Nel mondo dell'archeologia questa operazione è diventata preziosa con la disponibilità di un numero maggiore e migliore di immagini satellitari che possono essere combinate con fonti di informazione più vecchie (ad esempio, le immagini satellitari CORONA) per individuare un numero maggiore di siti archeologici e per tracciarne il loro sviluppo. successivo degrado dovuto a fattori antropici1. A seconda dell'area di indagine e delle dimensioni degli elementi archeologici da rilevare, l'impegno necessario, soprattutto in termini di tempo, può essere ingente per il ricercatore.

Questa collaborazione mirava a risolvere esattamente questo problema utilizzando modelli di deep learning per semplificare, ma non automatizzare completamente, il processo. Pertanto, partendo da un set di dati di forme vettoriali per tutti i siti archeologicamente registrati nella pianura alluvionale della Mesopotamia meridionale (che rappresenta una regione geomorfologica sufficientemente coerente), abbiamo addestrato un modello per rilevare e segmentare i siti in una data immagine di input. Nel corso del progetto sono emerse una serie di questioni che rendono questo problema particolarmente difficile da affrontare e portano a un’importante riflessione sull’uso del deep learning in generale e sul suo rapporto con gli esperti umani. Il set di dati, sebbene possa essere considerato molto ampio per l’archeologia del Vicino Oriente con i suoi quasi 5000 siti, è difficilmente sufficiente per addestrare un modello grande come quelli all’avanguardia che vediamo in uso oggi e, forse in modo più significativo , contiene molti casi visibili solo su alcune immagini antiche. Il primo problema viene comunemente risolto attraverso il trasferimento dell'apprendimento2. Questa tecnica consiste nel partire da un modello, pre-addestrato su un set di dati ampio e generale (ad esempio imagenet3), per poi perfezionarlo su un set di dati più piccolo ma più specifico, sfruttando le competenze precedentemente apprese per realizzare il nuovo compito più gestibile. Il secondo, tuttavia, mette a repentaglio sia la formazione che la valutazione, poiché il modello è spinto a fare classificazioni errate durante la formazione e anche se apprendesse rappresentazioni robuste che ignorano i cattivi esempi, avremmo difficoltà a rilevare se si tratta di un errore. dal modello o nelle etichette.