Ιδρυματικό Αποθετήριο
Πολυτεχνείο Κρήτης
EN  |  EL

Αναζήτηση

Πλοήγηση

Ο Χώρος μου

Σύγκριση συστημάτων τεχνητής νοημοσύνης για τον εντοπισμό αντικειμένων σε εικόνες μη επανδρωμένων οχημάτων

Trimas Christos

Απλή Εγγραφή


URIhttp://purl.tuc.gr/dl/dias/1EAC217C-4828-4475-8FA0-F7D8092501B9-
Αναγνωριστικόhttps://doi.org/10.26233/heallink.tuc.93339-
Γλώσσαen-
Μέγεθος2.3 megabytesen
Μέγεθος78 pagesen
ΤίτλοςComparison of artificial intelligence systems for the detection of objects on UAV-based imagesen
ΤίτλοςΣύγκριση συστημάτων τεχνητής νοημοσύνης για τον εντοπισμό αντικειμένων σε εικόνες μη επανδρωμένων οχημάτωνel
ΔημιουργόςTrimas Christosen
ΔημιουργόςΤριμας Χρηστοςel
Συντελεστής [Επιβλέπων Καθηγητής]Zervakis Michailen
Συντελεστής [Επιβλέπων Καθηγητής]Ζερβακης Μιχαηλel
Συντελεστής [Μέλος Εξεταστικής Επιτροπής]Lagoudakis Michailen
Συντελεστής [Μέλος Εξεταστικής Επιτροπής]Λαγουδακης Μιχαηλel
Συντελεστής [Μέλος Εξεταστικής Επιτροπής]Petrakis Evripidisen
Συντελεστής [Μέλος Εξεταστικής Επιτροπής]Πετρακης Ευριπιδηςel
ΕκδότηςΠολυτεχνείο Κρήτηςel
ΕκδότηςTechnical University of Creteen
Ακαδημαϊκή ΜονάδαTechnical University of Crete::School of Electrical and Computer Engineeringen
Ακαδημαϊκή ΜονάδαΠολυτεχνείο Κρήτης::Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστώνel
ΠερίληψηUnmanned Aerial Vehicles (UAVs) have experienced great growth and as of 2020 at least 100 countries use UAVs in tactical options, while at the same time even more commercial applications deploy drones, for example photography and filmmaking, smart crops, smart cities, emergency handling, drug delivery, traffic management, etc. The big success of UAVs came due to the huge growth of electronics and the revolution of data. One of the most popular application of drones is object detection before designing the planned operation, e.g. differentiate pedestrians from cars or bikes in cross-road management systems. Deep Learning algorithms have been proven to be the best solution in such kind of problems. This diploma thesis collects and studies some of the most well-known detection systems, it analyzes in theory and in practice an object detector, the famous single-stage detector RetinaNet. Furthermore, a modified model is proposed that utilizes more Convolutional Blocks and combines features from different levels of the Neural Network. The extra convolution block is a mirror of the FPN network; therefore, the new model is called “Two-Phase Feature Pyramid Network Retina”. Since the goal is to compare those models, the classic RetinaNet and the modified model, were trained and tested using the Stanford Drone Dataset, a dataset designed to train object detectors for UAVs. The modified model achieves an accuracy score 6% higher than the baseline model, and it seems to outperform the original model in every metric, such as Precision, Sensitivity and F1 score. Finally, both the original and the modified Retina, were compared with other well-known object detectors such as YOLO, Faster RCNN, SSD, etc. The proposed architecture seems to outperform almost every object detector from the literature in terms of mean Average Precision. In conclusion, the modified model can be used to detect small objects in applications where accuracy is a critical factor.en
ΠερίληψηΤα μη επανδρωμένα ιπτάμενα οχήματα έχουν βιώσει τεράστια εξέλιξη και από το 2020 τουλάχιστον 100 χώρες χρησιμοποιούν μη επανδρωμένα σε τακτικές επιλογές. Ταυτόχρονα χρησιμοποιούνται ολοένα και περισσότερο σε εμπορικές εφαρμογές, όπως η φωτογραφία, οι έξυπνες καλλιέργειες, έξυπνες πόλεις, επιχειρήσεις διάσωσης και διαχείρισης κρίσεων, αποσυμφόρηση οδικών αρτηριών κλπ.. Η μεγάλη επιτυχία των μη επανδρωμένων ήρθε με την εξέλιξη των ηλεκτρονικών και την επανάσταση των δεδομένων που χρησιμοποιούνται σε έξυπνα συστήματα αποφάσεων. Μια από τις πιο διαδεδομένες εφαρμογές των drones είναι η αναγνώριση αντικειμένων για τον ακριβή σχεδιασμό της ολικής λειτουργίας του συστήματος, π.χ. διαχωρισμός των πεζών από τα αυτοκίνητα και τις μηχανές σε συστήματα διαχείρισης της κυκλοφορίας. Οι αλγόριθμοι βαθιάς μηχανικής μάθησης έχουν αποδειχθεί ως η καλύτερη λύση σε προβλήματα τέτοιου τύπου. Η παρούσα διπλωματική εργασία συλλέγει και μελετά μερικά από τα πιο γνωστά μοντέλα αναγνώρισης αντικειμένων, γίνεται μια πλήρης ανάλυση τόσο σε θεωρητικό, όσο και σε πρακτικό επίπεδο ενός ανιχνευτή αντικειμένων, του γνωστού RetinaNet. Επιπλέον, προτείνεται μια τροποποίηση του RetinaNet με προσθήκη επιπλέον συνελικτικών μπλοκ και συνδυασμό features από διαφορετικά επίπεδα του Νευρωνικού Δικτύου. Καθώς ο στόχος είναι η σύγκριση αυτών των μοντέλων, τόσο το κλασσικό RetinaNet, όσο και το τροποποιημένο μοντέλο, εκπαιδεύονται και ελέγχονται πάνω στο Stanford Drone Dataset, ένα dataset για την εκπαίδευση μοντέλων αναγνώρισης αντικειμένων από μη επανδρωμένα. Το τροποποιημένο μοντέλο πετυχαίνει αύξηση ακρίβειας από το κλασσικό μοντέλο της τάξης του 6%, ενώ αποδίδει καλύτερα σε όλα τα επίπεδα σύγκρισης ως προς την ακρίβεια, την ευαισθησία και το F1 score. Τέλος, γίνεται μια σύγκριση τόσο του RetinaNet, όσο και του modified RetinaNet με άλλους γνωστούς ανιχνευτές αντικειμένων όπως τα YOLO, Faster RCNN, SSD, κλπ και γενικά η προτεινόμενη αρχιτεκτονική φαίνεται να ξεπερνά σχεδόν όλα τα άλλα μοντέλα ως προς την μέσο όρο ακρίβειας. Συμπερασματικά, το μοντέλο φαίνεται να είναι κατάλληλο για ανίχνευση μικρών αντικειμένων, όπου η ακρίβεια αποτελεί το κυριότερο κριτήριο επιλογής ανιχνευτή.el
ΤύποςΔιπλωματική Εργασίαel
ΤύποςDiploma Worken
Άδεια Χρήσηςhttp://creativecommons.org/licenses/by/4.0/en
Ημερομηνία2022-09-13-
Ημερομηνία Δημοσίευσης2022-
Θεματική ΚατηγορίαObject detectionen
Θεματική ΚατηγορίαDeep learningen
Βιβλιογραφική ΑναφοράChristos Trimas, "Comparison of artificial intelligence systems for the detection of objects on UAV-based images", Diploma Work, School of Electrical and Computer Engineering, Technical University of Crete, Chania, Greece, 2022en
Βιβλιογραφική ΑναφοράΧρήστος Τρίμας, "Σύγκριση συστημάτων τεχνητής νοημοσύνης για τον εντοπισμό αντικειμένων σε εικόνες μη επανδρωμένων οχημάτων", Διπλωματική Εργασία, Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών, Πολυτεχνείο Κρήτης, Χανιά, Ελλάς, 2022el

Διαθέσιμα αρχεία

Υπηρεσίες

Στατιστικά