Ιδρυματικό Αποθετήριο
Πολυτεχνείο Κρήτης
EN  |  EL

Αναζήτηση

Πλοήγηση

Ο Χώρος μου

Αυτόνομη πλοήγηση drone για εκτίμηση θέσης διακριτικών με χρήση ενισχυτικής μάθησης

Galanis Michalis

Απλή Εγγραφή


URIhttp://purl.tuc.gr/dl/dias/8E9F870F-EF8B-42A0-AFC6-488BF38B90DF-
Αναγνωριστικόhttps://doi.org/10.26233/heallink.tuc.90434-
Γλώσσαen-
Μέγεθος108 pagesen
Μέγεθος6.2 megabytesen
ΜέγεθοςA4 (210x297mm)en
ΤίτλοςAutonomous drone navigation for landmark position estimation using reinforcement learningen
ΤίτλοςΑυτόνομη πλοήγηση drone για εκτίμηση θέσης διακριτικών με χρήση ενισχυτικής μάθησηςel
ΔημιουργόςGalanis Michalisen
ΔημιουργόςΓαλανης Μιχαληςel
Συντελεστής [Επιβλέπων Καθηγητής]Lagoudakis Michailen
Συντελεστής [Επιβλέπων Καθηγητής]Λαγουδακης Μιχαηλel
Συντελεστής [Μέλος Εξεταστικής Επιτροπής]Zervakis Michailen
Συντελεστής [Μέλος Εξεταστικής Επιτροπής]Ζερβακης Μιχαηλel
Συντελεστής [Μέλος Εξεταστικής Επιτροπής]Partsinevelos Panagiotisen
Συντελεστής [Μέλος Εξεταστικής Επιτροπής]Παρτσινεβελος Παναγιωτηςel
ΕκδότηςΠολυτεχνείο Κρήτηςel
ΕκδότηςTechnical University of Creteen
Ακαδημαϊκή ΜονάδαTechnical University of Crete::School of Electrical and Computer Engineeringen
Ακαδημαϊκή ΜονάδαΠολυτεχνείο Κρήτης::Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστώνel
ΠερίληψηUnmanned aerial vehicles (UAVs) have been increasingly used for critical and challenging applications, which often require a substantial level of autonomy. Several approaches have been investigated to create autonomous navigation systems such as Simultaneous Localization and Mapping (SLAM) using real-time mapping and position estimation. Reinforcement leaning (RL) is a promising alternative that focuses on learning to perform a task through a trial-and-error procedure, in which an agent interacts with its environment and receives continuous feedback based on the actions taken, with no access to any information about the environment itself. Eventually, the agent’s objective is to find the best possible sequence of actions that lead to the maximum total reward in the long term. This thesis explores a mapless approach to UAV autonomous navigation in completely unknown 3D environments using deep reinforcement learning (DRL), a reinforcement learning approach that incorporates deep learning techniques (deep neural networks) to overcome dimensionality limitations. The goal of the agent is to safely navigate through this unknown environment, so as to detect and approach a predefined set of ArUco markers (landmarks) placed within the environment. The unknown environments are dynamically created and contain a number of procedurally generated obstacles. We evaluate our agent in five different environment profiles with increasing difficulty level and observe how environment complexity affects training performance. Results show that deep reinforcement learning can be effective and can be successfully used for autonomous navigation missions. The entire project was implemented using the Robot Operating System (ROS) platform within the Gazebo robot simulator environment.en
ΠερίληψηΤα μη επανδρωμένα αεροσκάφη (Unmanned Aerial Vehicles, UAVs) χρησιμοποιούνται ολοένα και περισσότερο για κρίσιμες και απαιτητικές εφαρμογές, οι οποίες συχνά απαιτούν ένα σημαντικό επίπεδο αυτονομίας. ‘ ́Εχουν διερευνηθεί διάφορες προσεγγίσεις για τη δημιουργία συστημάτων αυτόνομης πλοήγησης, όπως ο ταυτόχρονος εντοπισμός και χαρτογράφηση (SLAM) που υλοποιεί σε πραγματικό χρόνο χαρτογράφηση και εκτίμηση θέσης. Η Ενισχυτική Μάθηση (Reinforcement Learning, RL) θεωρείται μια πολλά υποσχόμενη εναλλακτική λύση που επικεντρώνεται στη μάθηση κάποιου έργου μέσω μιας διαδικασίας δοκιμής και σφάλματος, στην οποία ένας πράκτορας αλληλεπιδρά με το περιβάλλον του και λαμβάνει συνεχή αξιολόγηση εξαρτώμενη από τις ενέργειες που επιλέγει, χωρίς ωστόσο να έχει πρόσβαση σε πληροφορίες για το ίδιο το περιβάλλον. Εν τέλει, ο στόχος του πράκτορα είναι να βρει την καλύτερη δυνατή ακολουθία ενεργειών που θα εξασφαλίσουν τη μέγιστη συνολική ανταμοιβή μακροπρόθεσμα. Η παρούσα διπλωματική εργασία διερευνά μια προσέγγιση αυτόνομης πλοήγησης αεροσκαφών (χωρίς χάρτη) σε εντελώς άγνωστα τρισδιάστατα περιβάλλοντα χρησιμοποιώντας βαθιά ενισχυτική μάθηση (Deep Reinforcement Learning, DRL), μια προσέγγιση ενισχυτικής μάθησης που ενσωματώνει τεχνικές βαθιάς μάθησης (βαθιά νευρωνικά δίκτυα) για να αντιμετωπιστούν οι περιορισμοί διαστατικότητας. Ο στόχος του πράκτορα είναι να περιηγηθεί με ασφάλεια στο άγνωστο περιβάλλον, ώστε να εντοπίσει και να προσεγγίσει έναν προκαθορισμένο αριθμό διακριτικών δεικτών ArUco που είναι τοποθετημένοι μέσα στο περιβάλλον. Τα άγνωστα περιβάλλοντα δημιουργούνται δυναμικά και συμπεριλαμβάνουν έναν πλήθος από εμπόδια παραγόμενα με αυτοματοποιημένο τρόπο. Αξιολογούμε τον πράκτορας μας σε πέντε διαφορετικά προφίλ περιβαλλόντων με αυξανόμενο επίπεδο δυσκολίας και παρατηρούμε πως η πολυπλοκότητα του περιβάλλοντος επηρεάζει την απόδοση της μάθησης. Τα αποτελέσματα δείχνουν ότι η βαθιά ενισχυτική μάθηση μπορεί να είναι αποτελεσματική και μπορεί να χρησιμοποιηθεί επιτυχώς σε αποστολές αυτόνομης πλοήγησης. Η εργασία στο σύνολό της έχει υλοποιηθεί μέσω της πλατφόρμας Robot Operating System (ROS) στο περιβάλλον ρομποτικής προσομοίωσης Gazebo.el
ΤύποςΔιπλωματική Εργασίαel
ΤύποςDiploma Worken
Άδεια Χρήσηςhttp://creativecommons.org/licenses/by/4.0/en
Ημερομηνία2021-10-11-
Ημερομηνία Δημοσίευσης2021-
Θεματική Κατηγορία3D environmenten
Θεματική ΚατηγορίαArtificial intelligenceen
Θεματική ΚατηγορίαArtificial neural networken
Θεματική ΚατηγορίαArUco markeren
Θεματική ΚατηγορίαArUco marker detectionen
Θεματική ΚατηγορίαArUco tagen
Θεματική ΚατηγορίαAutonomous UAV navigationen
Θεματική ΚατηγορίαDeep learningen
Θεματική ΚατηγορίαDeep neural networken
Θεματική ΚατηγορίαDeep reinforcement learningen
Θεματική ΚατηγορίαDQNen
Θεματική ΚατηγορίαDroneen
Θεματική ΚατηγορίαDrone aircraften
Θεματική ΚατηγορίαDynamic environmenten
Θεματική ΚατηγορίαEnvironmenten
Θεματική ΚατηγορίαFully connected layeren
Θεματική ΚατηγορίαGazeboen
Θεματική ΚατηγορίαInertial measurement uniten
Θεματική ΚατηγορίαKerasen
Θεματική ΚατηγορίαLandmark position estimationen
Θεματική ΚατηγορίαLIDARen
Θεματική ΚατηγορίαMachine visionen
Θεματική ΚατηγορίαNeural networken
Θεματική ΚατηγορίαObstacle avoidanceen
Θεματική ΚατηγορίαObstaclesen
Θεματική ΚατηγορίαOpenAI Gymen
Θεματική ΚατηγορίαOptical cameraen
Θεματική ΚατηγορίαQ-Learningen
Θεματική ΚατηγορίαReinforcement learningen
Θεματική ΚατηγορίαRewarden
Θεματική ΚατηγορίαROSen
Θεματική ΚατηγορίαROS transformationsen
Θεματική ΚατηγορίαSensorsen
Θεματική ΚατηγορίαSONARen
Θεματική ΚατηγορίαTarget approachen
Θεματική ΚατηγορίαTensorflowen
Θεματική ΚατηγορίαTrainingen
Θεματική ΚατηγορίαUnknown environmenten
Θεματική ΚατηγορίαUnmanned eerial vehicleen
Θεματική ΚατηγορίαValue function approximationen
Θεματική ΚατηγορίαAutonomous drone navigationen
Βιβλιογραφική ΑναφοράMichalis Galanis, "Autonomous drone navigation for landmark position estimation using reinforcement learning", Diploma Work, School of Electrical and Computer Engineering, Technical University of Crete, Chania, Greece, 2021en
Βιβλιογραφική ΑναφοράΜιχάλης Γαλάνης, "Αυτόνομη πλοήγηση drone για εκτίμηση θέσης διακριτικών με χρήση ενισχυτικής μάθησης", Διπλωματική Εργασία, Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών, Πολυτεχνείο Κρήτης, Χανιά, Ελλάς, 2021el

Διαθέσιμα αρχεία

Υπηρεσίες

Στατιστικά