Σύγκριση συστημάτων τεχνητής νοημοσύνης για τον εντοπισμό αντικειμένων σε εικόνες μη επανδρωμένων οχημάτων

Trimas Christos

Πλήρης Εγγραφή

URI:

http://purl.tuc.gr/dl/dias/1EAC217C-4828-4475-8FA0-F7D8092501B9

Έτος

2022

Τύπος

Διπλωματική Εργασία

Άδεια Χρήσης

Λεπτομέρειες

Βιβλιογραφική Αναφορά

Χρήστος Τρίμας, "Σύγκριση συστημάτων τεχνητής νοημοσύνης για τον εντοπισμό αντικειμένων σε εικόνες μη επανδρωμένων οχημάτων", Διπλωματική Εργασία, Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών, Πολυτεχνείο Κρήτης, Χανιά, Ελλάς, 2022 https://doi.org/10.26233/heallink.tuc.93339

Εμφανίζεται στις Συλλογές

Διπλωματικές Εργασίες στην Κοινότητα Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών

Διπλωματικές Εργασίες στην Κοινότητα Εργαστήριο Ψηφιακής Επεξεργασίας Σημάτων και Εικόνας

Περίληψη

Τα μη επανδρωμένα ιπτάμενα οχήματα έχουν βιώσει τεράστια εξέλιξη και από το 2020 τουλάχιστον 100 χώρες χρησιμοποιούν μη επανδρωμένα σε τακτικές επιλογές. Ταυτόχρονα χρησιμοποιούνται ολοένα και περισσότερο σε εμπορικές εφαρμογές, όπως η φωτογραφία, οι έξυπνες καλλιέργειες, έξυπνες πόλεις, επιχειρήσεις διάσωσης και διαχείρισης κρίσεων, αποσυμφόρηση οδικών αρτηριών κλπ.. Η μεγάλη επιτυχία των μη επανδρωμένων ήρθε με την εξέλιξη των ηλεκτρονικών και την επανάσταση των δεδομένων που χρησιμοποιούνται σε έξυπνα συστήματα αποφάσεων. Μια από τις πιο διαδεδομένες εφαρμογές των drones είναι η αναγνώριση αντικειμένων για τον ακριβή σχεδιασμό της ολικής λειτουργίας του συστήματος, π.χ. διαχωρισμός των πεζών από τα αυτοκίνητα και τις μηχανές σε συστήματα διαχείρισης της κυκλοφορίας. Οι αλγόριθμοι βαθιάς μηχανικής μάθησης έχουν αποδειχθεί ως η καλύτερη λύση σε προβλήματα τέτοιου τύπου. Η παρούσα διπλωματική εργασία συλλέγει και μελετά μερικά από τα πιο γνωστά μοντέλα αναγνώρισης αντικειμένων, γίνεται μια πλήρης ανάλυση τόσο σε θεωρητικό, όσο και σε πρακτικό επίπεδο ενός ανιχνευτή αντικειμένων, του γνωστού RetinaNet. Επιπλέον, προτείνεται μια τροποποίηση του RetinaNet με προσθήκη επιπλέον συνελικτικών μπλοκ και συνδυασμό features από διαφορετικά επίπεδα του Νευρωνικού Δικτύου. Καθώς ο στόχος είναι η σύγκριση αυτών των μοντέλων, τόσο το κλασσικό RetinaNet, όσο και το τροποποιημένο μοντέλο, εκπαιδεύονται και ελέγχονται πάνω στο Stanford Drone Dataset, ένα dataset για την εκπαίδευση μοντέλων αναγνώρισης αντικειμένων από μη επανδρωμένα. Το τροποποιημένο μοντέλο πετυχαίνει αύξηση ακρίβειας από το κλασσικό μοντέλο της τάξης του 6%, ενώ αποδίδει καλύτερα σε όλα τα επίπεδα σύγκρισης ως προς την ακρίβεια, την ευαισθησία και το F1 score. Τέλος, γίνεται μια σύγκριση τόσο του RetinaNet, όσο και του modified RetinaNet με άλλους γνωστούς ανιχνευτές αντικειμένων όπως τα YOLO, Faster RCNN, SSD, κλπ και γενικά η προτεινόμενη αρχιτεκτονική φαίνεται να ξεπερνά σχεδόν όλα τα άλλα μοντέλα ως προς την μέσο όρο ακρίβειας. Συμπερασματικά, το μοντέλο φαίνεται να είναι κατάλληλο για ανίχνευση μικρών αντικειμένων, όπου η ακρίβεια αποτελεί το κυριότερο κριτήριο επιλογής ανιχνευτή.

Αναζήτηση

Πλοήγηση

Ο Χώρος μου

Σύγκριση συστημάτων τεχνητής νοημοσύνης για τον εντοπισμό αντικειμένων σε εικόνες μη επανδρωμένων οχημάτων

Trimas Christos

Περίληψη

Διαθέσιμα αρχεία

Υπηρεσίες

Εξαγωγή

Κοινοποίηση

Στατιστικά

Μεταδεδομένων & Περιεχομένου σε METS:

Μεταδεδομένων σε Μορφότυπο: