Wikidata e biblioteche per l'AI

Published: 05 Feb 2025, Last Modified: 23 Apr 2025Submitted to WD&REveryoneRevisionsBibTeXCC BY-SA 4.0
Confirmation: I have read and agree with the workshop's policy on behalf of myself and my co-authors.
Authors Biographies: Lorenzo Gobbo: Laureato in biblioteconomia e archivistica attualmente lavora come bibliotecario presso le Biblioteche universitarie di Lugano e Mendrisio dove si occupa di servizi digitali, sviluppo applicazioni e Linked Open Data. Socio AIB, è membro del Gruppo di studio sulle tecnologie dell’informazione nelle biblioteche e biblioteche digitali e collabora con la Biblioteca Nazionale Centrale di Firenze per lo sviluppo di progetti di ricerca applicata nel campo dell’indicizzazione e classificazione automatica. Elisabetta Zonca: Laureata in storia e con un dottorato in scienze Bibliografiche, attualmente lavora presso la Biblioteca dell'Accademia di architettura a Mendrisio, dove si occupa delle collezioni speciali e dell'Iconoteca. Socia AIB da diversi anni, è membro del CER Lombardia e dello Standing Committee IFLA Rare Books and Special Collections.
Keywords: Biblioteche, Indici, LOD, AI, Wikidata
TL;DR: Proposta sul ruolo che Wikidata e biblioteche potranno avere all'interno degli ambiti di ricerca relativi al Natural Language Processing, al Machine Learning e all'Intelligenza Artificiale
Abstract: L'intervento propone l'utilizzo di Wikidata come un indice di database e come punto di accesso per la scoperta e la raccolta automatizzata di base dati. Inoltre si propone di presentare delle proposte sul ruolo che Wikidata e biblioteche potranno avere all'interno degli ambiti di ricerca relativi al Natural Language Processing, al Machine Learning e all'Intelligenza Artificiale. La natura aperta dell'ecosistema di Wikidata e la possibilità di editare e creare 'liberamente' nuovi elementi, se da un lato sembra permettere una maggior rappresentatività delle entità del mondo reale rispetto ad altri sistemi chiusi, dall'altra pone una serie di criticità per quanto riguarda l'attendibilità e la qualità dei dati disponibili. Per superare queste criticità si propone l'utilizzo di Wikidata come indice, ovvero come sistema di scoperta e aggregazione di dati autorevoli in grado di condurre, partendo da una entità, a dati ospitati esternamente accessibili in forma machine-readable e direttamente importabili nel proprio sistema in quanto espressi sotto forma di Linked Open Data. Utilizzando l’esempio della collezione iconografica della Biblioteca dell’Accademia di architettura di Mendrisio, questo intervento propone una serie di strategie in grado di condurre a un miglioramento della ricercabilità e del riuso delle collezioni digitali delle biblioteche. Le ricadute che questo approccio consente spaziano dalla ottimizzazione della gestione automatizzata degli authority files, fino alla disseminazione di dati nevralgici ai fini della valorizzazione del patrimonio culturale. Il secondo punto di cui si vuole discutere riguarda il ruolo che le biblioteche potrebbero rivestire nello sviluppo dell’Intelligenza Artificiale, ponendosi come soggetti attivi dello sviluppo della componente software e non solo come utilizzatori finali di prodotti commerciali. In una fase storica, e in un paese come l’Italia, in cui la fase di addestramento delle macchine è una questione aperta sulla quale è possibile agire positivamente, riteniamo sia possibile e necessario ipotizzare un coinvolgimento delle biblioteche. La qualità del risultato prodotto da Modelli Linguistici di grandi dimensioni (LLMs), così come da modelli di dimensioni ridotte più specifici, dipende inevitabilmente dalla quantità e qualità dei dati utilizzati per l’addestramento. Nel nuovo ecosistema digitale le biblioteche possono supportare i propri utenti agendo come data provider per i ricercatori come per i servizi commerciali generalisti.
Format: Paper (20 minutes presentation)
Submission Number: 38
Loading

OpenReview is a long-term project to advance science through improved peer review with legal nonprofit status. We gratefully acknowledge the support of the OpenReview Sponsors. © 2025 OpenReview