Ιδρυματικό Αποθετήριο
Πολυτεχνείο Κρήτης
EN  |  EL

Αναζήτηση

Πλοήγηση

Ο Χώρος μου

Δημιουργία παραμετροποιήσιμων ρομποτικών περιβαλλόντων ενισχυτικής μάθησης

Kallinteris Andreas

Πλήρης Εγγραφή


URI: http://purl.tuc.gr/dl/dias/C2182ACC-1A55-48C2-8366-8094FE4CD43B
Έτος 2025
Τύπος Διπλωματική Εργασία
Άδεια Χρήσης
Λεπτομέρειες
Βιβλιογραφική Αναφορά Ανδρέας Καλλιντέρης, "Δημιουργία παραμετροποιήσιμων ρομποτικών περιβαλλόντων ενισχυτικής μάθησης", Διπλωματική Εργασία, Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών, Πολυτεχνείο Κρήτης, Χανιά, Ελλάς, 2025 https://doi.org/10.26233/heallink.tuc.102570
Εμφανίζεται στις Συλλογές

Περίληψη

Η δημιουργία τυποποιημένων υλοποιήσεων περιβάλλοντος και ενός Application Programming Interface (API) για το OpenAI/Gym, έπαιξε καθοριστικό ρόλο στην πρόσφατη πρόοδο της έρευνας για reinforcement learning (RL). Ωστόσο, το περιορισμένο σε αριθμό και δυνατότητες τρέχον σύνολο τυποποιημένων περιβαλλόντων αποτελεί εν δυνάμει εμπόδιο για την περαιτέρω πρόοδο των αλγορίθμων ενισχυτικής μάθησης. Στην παρούσα διπλωματική εργασία, έχουμε αναπτύξει και παρέχουμε μια πληθώρα νέων περιβαλλόντων και πλαισίων για ρομποτική ενισχυτική μάθηση, συμπεριλαμβανομένων των Gymnasium/Mujoco-v5, Gymnasium-Robotics/Maze-v5, και Gymnasium-Robotics/MaMuJoCo, μαζί με σύνολα δεδομένων για χρήση από offline RL μεθόδους σε περιβάλλοντα Gymnasium/MuJoCo με το Minari API. Οι συνεισφορές μας αυτές μπορούν δυνητικά να επιτρέψουν στους ερευνητές να αναπτύξουν και να δοκιμάσουν νέους αλγορίθμους σε πιο ρεαλιστικά και δύσκολά περιβάλλοντα, το οποίο τελικά θα οδηγήσει σε πιο ισχυρούς και γενικεύσιμους αλγορίθμους ενισχυτικής μάθησης.

Διαθέσιμα αρχεία

Υπηρεσίες

Στατιστικά