Modelli di diffusione probabilistici applicati al miglioramento delle immagini in condizioni di scarsa illuminazione
Abstract: Questa tesi tratta il problema di miglioramento di immagini in condizioni di scarsa luminosità (LLIE). Esso rappresenta un'importante area di ricerca con numerose applicazioni in ambiti differenti. Infatti, quando la luce è scarsa, il rumore intrinseco del sensore della fotocamera viene amplificato, producendo immagini a bassa qualità con molto rumore e dettagli sfocati. QUesta degrazione impatta negativamente l'estrazione di features dalle immagini, elemento cruciale per l'efficacia nell'ambito di \textit{computer vision}. Per questa ragione, molte applicazioni di \textit{computer vision} come rilevamento di oggetti, video sorveglianza e tracciamento di oggetti si basano sul miglioramento di immagini a bassa luminosità in modo da garantire un miglioramento delle performance.
Nell'ultimo periodo, le reti neurali artificiali (ANNs) sono diventati un ambito di ricerca di grande interesse con applicazioni in molti ambiti come \textit{computer vision}, \textit{natural language processing}, generazione di immagini, suoni e video. Tra i più recenti avanzamenti, il modello generativo noto come \textit{Denoising Diffusion Probabilistic Model} (DDPM) ha riscosso molto successo per le sue eccellenti performance nella generazione di immagini. Esso si basa su due processi: \textit{forward}, durante il quale viene gradualmente aggiunto del rumore, e \textit{reverse}, il quale utilizza una rete neurale per stimare la quantità di rumore aggiunta nel primo processo.
In particolare, questa tesi introduce un nuovo approccio \textit{supervised} per risolvere il problema del miglioramento di immagini in condizioni di scarsa luminosità utilizzando i \textit{Denoising Diffusion Probabilistic Model}. Questo metodo amibisce a stimare la distribuzione di immagini in condizione di luce ottimali e permettendone così, data un'immagine a bassa luminosità, il campionamento della versione migliorata.
Il lavoro è organizzato in tre capitoli. Il primo capitolo fornisce un'introduzione al problema. Innazitutto, viene presentata una panoramica sulle reti neurali e le più importanti architetture. Dopodiché, il focus si sposta sulla formulazione dei \textit{Denoising Diffusion Probabilistic Models}. Infine, viene introdotto il problema del miglioramento delle immagini in condizioni di scarsa illuminazione, sottolineandone l'importanza e le maggiori difficoltà.
Il secondo capitolo presenta i risultati degli esperimenti. Esso inizia con un'introduzione all'ambiente di lavoro, discutendo degli strumenti utilizzati, dell'approccio condizionato dei DDPM e la relativa applicazione al metodo sviluppato in questo elaborato. La sezione successiva è dedicat agli esperimenti effettuati su immagini di dimensione $32 \times 32$ in modo da comprendere l'efficacia dell'approccio e le migliori configurazioni con un numero di parametri più maneggevole. Dopodiché, le migliori configurazioni sono sperimentate su immagini a dimensione $128\times 128$. Infine, è presentata una discussione di tutti gli esperimenti effettuati.
Il capitolo conclusivo raccoglie le considerazioni finali sul lavoro compiute e ne presenta future esplorazioni.
Loading