Δημιουργία παραμετροποιήσιμων ρομποτικών περιβαλλόντων ενισχυτικής μάθησης

Kallinteris Andreas

Πλήρης Εγγραφή

URI:

http://purl.tuc.gr/dl/dias/C2182ACC-1A55-48C2-8366-8094FE4CD43B

Έτος

2025

Τύπος

Διπλωματική Εργασία

Άδεια Χρήσης

Λεπτομέρειες

Βιβλιογραφική Αναφορά

Ανδρέας Καλλιντέρης, "Δημιουργία παραμετροποιήσιμων ρομποτικών περιβαλλόντων ενισχυτικής μάθησης", Διπλωματική Εργασία, Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών, Πολυτεχνείο Κρήτης, Χανιά, Ελλάς, 2025 https://doi.org/10.26233/heallink.tuc.102570

Εμφανίζεται στις Συλλογές

Διπλωματικές Εργασίες στην Κοινότητα Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών

Διπλωματικές Εργασίες στην Κοινότητα Εργαστήριο Προγραμματισμού και Τεχνολογίας Ευφυών Υπολογιστικών Συστημάτων

Περίληψη

Η δημιουργία τυποποιημένων υλοποιήσεων περιβάλλοντος και ενός Application Programming Interface (API) για το OpenAI/Gym, έπαιξε καθοριστικό ρόλο στην πρόσφατη πρόοδο της έρευνας για reinforcement learning (RL). Ωστόσο, το περιορισμένο σε αριθμό και δυνατότητες τρέχον σύνολο τυποποιημένων περιβαλλόντων αποτελεί εν δυνάμει εμπόδιο για την περαιτέρω πρόοδο των αλγορίθμων ενισχυτικής μάθησης. Στην παρούσα διπλωματική εργασία, έχουμε αναπτύξει και παρέχουμε μια πληθώρα νέων περιβαλλόντων και πλαισίων για ρομποτική ενισχυτική μάθηση, συμπεριλαμβανομένων των Gymnasium/Mujoco-v5, Gymnasium-Robotics/Maze-v5, και Gymnasium-Robotics/MaMuJoCo, μαζί με σύνολα δεδομένων για χρήση από offline RL μεθόδους σε περιβάλλοντα Gymnasium/MuJoCo με το Minari API. Οι συνεισφορές μας αυτές μπορούν δυνητικά να επιτρέψουν στους ερευνητές να αναπτύξουν και να δοκιμάσουν νέους αλγορίθμους σε πιο ρεαλιστικά και δύσκολά περιβάλλοντα, το οποίο τελικά θα οδηγήσει σε πιο ισχυρούς και γενικεύσιμους αλγορίθμους ενισχυτικής μάθησης.

Αναζήτηση

Πλοήγηση

Ο Χώρος μου

Δημιουργία παραμετροποιήσιμων ρομποτικών περιβαλλόντων ενισχυτικής μάθησης

Kallinteris Andreas

Περίληψη

Διαθέσιμα αρχεία

Υπηρεσίες

Εξαγωγή

Κοινοποίηση

Στατιστικά

Μεταδεδομένων & Περιεχομένου σε METS:

Μεταδεδομένων σε Μορφότυπο: