Το έργο με τίτλο Αυτοματοποιημένη κατάτμηση ψηφίδων μωσαϊκού με χρήση τεχνικών τεχνητής νοημοσύνης από τον/τους δημιουργό/ούς Kapelonis Charilaos διατίθεται με την άδεια Creative Commons Αναφορά Δημιουργού 4.0 Διεθνές
Βιβλιογραφική Αναφορά
Χαρίλαος Καπελώνης, "Αυτοματοποιημένη κατάτμηση ψηφίδων μωσαϊκού με χρήση τεχνικών τεχνητής νοημοσύνης", Διπλωματική Εργασία, Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών, Πολυτεχνείο Κρήτης, Χανιά, Ελλάς, 2025
https://doi.org/10.26233/heallink.tuc.104765
Η τέχνη αναγνωρίζεται ευρέως ως αντανάκλαση του πολιτισμού και τα ψηφιδωτά αντιπροσωπεύουν ένα σημαντικό κομμάτι της πολιτιστικής κληρονομιάς. Τα ψηφιδωτά είναι μια παλιά μορφή τέχνης όπου μια επιφάνεια διακοσμείται με την τοποθέτηση μικρών κομματιών υλικού, που ονομάζονται ψηφίδες, σε μια βάση με κόλλα. Λόγω της ηλικίας και της ευθραυστότητάς τους, είναι επιρρεπή σε φθορά, κάτι που αναδεικνύει την ανάγκη για την ψηφιακή τους διατήρηση.Αυτή η εργασία αντιμετωπίζει το πρόβλημα της ψηφιοποίησης των ψηφιδωτών μέσω της κατάτμησης των ψηφίδων, παράγοντας μια δυαδική εικόνα στην οποία αυτές διαχωρίζονται καθαρά από το φόντο. Αυτή η εργασία εμπίπτει στον τομέα της Κατάτμησης Εικόνας, ένα από τα κυριότερα προβλήματα της Μηχανικής Όρασης. Στοχεύουμε στη δημιουργία μιας μεθόδου που το επιτυγχάνει αυτόματα και με υψηλή ακρίβεια.Παρόλο που οι κλασσικές προσεγγίσεις στην Κατάτμηση Εικόνας παρουσιάζουν ικανοποιητικά αποτελέσματα, εμείς χρησιμοποιούμε μοντέλα Βαθιάς Μάθησης και, πιο συγκεκριμένα, η εργασία μας αξιοποιεί το πιο πρόσφατο μοντέλο Segment Anything Model 2 (SAM 2) της META AI, ένα θεμελιώδες μοντέλο που ξεπερνά τα περισσότερα κλασσικά μοντέλα κατάτμησης εικόνας. Η εργασία μας περιλαμβάνει χειροκίνητο annotation ενός συνόλου εικόνων ψηφιδωτών για τη δημιουργία ενός σετ δεδομένων, το οποίο χρησιμοποιούμε για τη βελτιστοποίηση του μοντέλου και την αξιολόγηση της απόδοσής του.Τα ποσοτικά αποτελέσματα, συμπεριλαμβανομένων των μετρικών αξιολόγησης, δείχνουν σημαντική βελτίωση σε σύγκριση με το αρχικό μοντέλο SAM 2. Το αρχικό μοντέλο SAM 2 - αξιολογημένο στο large checkpoint - αποδίδει 89.00% IoU και 92.12% Recall, ενώ το δικό μας μοντέλο πετυχαίνει 91.02% IoU και 95.89% Recall στο ίδιο σετ δεδομένων. Επιπλέον, δείχνουμε ότι η προσέγγισή μας μπορεί να αποδώσει ακόμη πιο αξιοσημείωτα αποτελέσματα εάν εκπαιδευτεί χωρίς περιορισμούς υπολογιστικής ισχύος και χρόνου.Το παρόν πρόβλημα ανήκει στον τομέα των προβλημάτων Μηχανικής Όρασης, επομένως τα ποιοτικά αποτελέσματα, όπως οπτικές συγκριτικές απεικονίσεις, είναι εξίσου σημαντικά. Αυτές οι απεικονίσεις επιβεβαιώνουν ότι το μοντέλο που χρησιμοποιούμε μετά τη βελτιστοποίηση μας φέρνει πιο κοντά σε μια αποτελεσματική λύση για αυτό το πρόβλημα.Λέξεις-Κλειδιά: Ψηφιδωτά, Βαθιά Μάθηση, Μηχανική Όραση, Κατάτμηση Εικόνας, SAM 2, Μεταφορά Μάθησης, Ψηφιακή Διατήρηση