Ιδρυματικό Αποθετήριο
Πολυτεχνείο Κρήτης
EN  |  EL

Αναζήτηση

Πλοήγηση

Ο Χώρος μου

Ανάλυση εικόνων καρδιακής ανατομίας με χρήση Νευρωνικών Δικτύων (Vision Transformers)

Naka Stelina

Πλήρης Εγγραφή


URI: http://purl.tuc.gr/dl/dias/97234BFD-DFEF-4503-BC69-06200F50D07A
Έτος 2025
Τύπος Διπλωματική Εργασία
Άδεια Χρήσης
Λεπτομέρειες
Βιβλιογραφική Αναφορά Στελίνα Νάκα, "Ανάλυση εικόνων καρδιακής ανατομίας με χρήση Νευρωνικών Δικτύων (Vision Transformers) ", Διπλωματική Εργασία, Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών, Πολυτεχνείο Κρήτης, Χανιά, Ελλάς, 2025 https://doi.org/10.26233/heallink.tuc.102213
Εμφανίζεται στις Συλλογές

Περίληψη

Η καρδιά είναι ένα από τα πιο πολύπλοκα όργανα του ανθρώπινου σώματος με πολλαπλά μέρη και η ανατομία ολόκληρης της καρδιάς αποτελεί βασική προϋπόθεση για την ανάπτυξη πολλών κλινικών εφαρμογών. Για τη μελέτη της λειτουργίας της καρδιάς σε χωρικό επίπεδο, η Μαγνητική Τομογραφία (MRI) και η Αξονική Τομογραφία (CT) είναι οι πιο συνηθισμένες μέθοδοι. Στο πλαίσιο αυτό, η κατάτμηση ολόκληρης της καρδιάς είναι ζωτικής σημασίας στην ανάλυση ιατρικών εικόνων, παρέχοντας δυνατότητες για διάγνωση και την επιλογή θεραπείας των Καρδιαγγειακών Νοσημάτων (CVD). Ωστόσο, η αυτοματοποιημένη κατάτμηση μπορεί να γίνει απαιτητική λόγω της παραλλαγής στο σχήμα της καρδιάς από άνθρωπο σε άνθρωπο. Σε αυτή την μελέτη, προτείνεται μια ενισχυμένη μέθοδος βασισμένη στις γνώσεις που προέκυψαν από τα ευρήματα των αξιολογήσεων του διαγωνισμού MICCAI Multi-Modality Whole Heart Segmentation (MM-WHS). Ο διαγωνισμός παρέχει ένα σύνολο δεδομένων που περιλαμβάνει 20 MRI και 20 CT τρισδιάστατες εικόνες και τις χειροκίνητα κατατετμημένες ετικέτες τους. Ενώ οι περισσότερες από τις αυτοματοποιημένα μοντέλα κατάτμησης ιατρικών εικόνων βασίζονται σε Convolutional Neural Networks (CNN), στην διατριβή αυτή παρουσιάζεται ένα υβριδικό μοντέλο Vision Tranformer (ViT). Το προτεινόμενο μοντέλο, με όνομα ’ViTSegment’, είναι ένας κωδικοποιητής βασισμένος σε Vision Transformer για την καταγραφή εξαρτήσεων μεγάλης κλίμακας και ένας αποκωδικοποιητής συνελικτικού τύπου για την ακριβή ανίχνευση των ορίων. Ο προτεινόμενος αλγόριθμος εκπαιδεύτηκε και αξιολογήθηκε στο σύνολο δεδομένων του διαγωνισμού. Λόγω του μικρού αριθμού δεδομένων, προχωρήσαμε περαιτέρω με τεχνικές αύξησης δεδομένων (data augmentation) για την επέκταση του συνόλου δεδομένων. Στο σύνολο δεδομένων CT παρουσίασε καλύτερο Dice score 92.65 ± 2.17% σε σύγκριση με το MRI σύνολο (91.50 ± 1.72%). Για τη βελτίωση των αποτελεσμάτων της αξιολόγησης, πραγματοποιήθηκε συγκριτική ανάλυση μεταξύ των μοντέλων ViTSegment, U-Net και UNETR. Το ViTSegment υπερέχει των άλλων δύο μοντέλων, με το U-Net να επιτυγχάνει Dice score 82.67 ± 8.70% στο σύνολο CT και 81.30 ± 5.47% στο MRI, ενώ το UNETR σημειώνει 86.33 ± 0.74% για το CT και 84.94 ± 6.25% για το MRI, αναδεικνύοντας τη σταθερότητα και την αποδοτικότητα του. Το μοντέλο ViTSegment παρουσιάζει σημαντικές προοπτικές, ανοίγοντας τον δρόμο για αξιόπιστη αυτόματη κατάτμηση ολόκληρης της καρδιάς στην ανάλυση ιατρικών εικόνων.

Διαθέσιμα αρχεία

Υπηρεσίες

Στατιστικά