Institutional Repository
Technical University of Crete
EN  |  EL

Search

Browse

My Space

Ενισχυτική μάθηση ρομποτικού ελέγχου μέσω πιθανοτικού συμπερασμού

Vlassis Nikolaos, Kontes Georgios, Piperidis Savvas

Full record


URI: http://purl.tuc.gr/dl/dias/A14031E6-2685-4574-881F-77A04017278C
Year 2009
Type of Item Conference Full Paper
License
Details
Bibliographic Citation Ν. Βλάσσης, Γ. Κόντες, Σ. Πιπερίδης, "Ενισχυτική Μάθηση Ρομποτικού Ελέγχου Μέσω Πιθανοτικού Συμπερασμού," στο 1ο Πανελλήνιο Συνέδριο Ρομποτικής, 23-24 Φεβρουαρίου, 2009.
Appears in Collections

Summary

Παρουσιάζουμε μία νέα προσέγγιση στο πρόβλημα της αυτόματης μάθησης ρομποτικού ελέγ-χου με Ενισχυτική Μάθηση (Reinforcement Learning, RL). Πρόσφατες εργασίες στη βιβλιο-γραφία έχουν δείξει ότι ένα πρόβλημα Βέλτιστου Ελέγχου Διακριτού Χρόνου (Discrete TimeOptimal Control) μπορεί να αναχθεί σε ένα πρόβλημα Πιθανοτικού Συμπερασμού (ProbabilisticInference) και να λυθεί με αντίστοιχες τεχνικές. Στην παρούσα εργασία δείχνουμε ότι μια τέτοιααναγωγή είναι επίσης δυνατή στην περίπτωση που το δυναμικό μοντέλου του συστήματος είναιάγνωστο, οπότε η μάθηση του ρομποτικού ελέγχου θα πρέπει να γίνει με μεθοδολογίες δοκιμής-και-σφάλματος (trial-and-error). Η ανάλυση που προτείνουμε οδηγεί σε ένα Monte-Carlo αλ-γόριθμο Προσδοκίας-Μεγιστοποίησης (Expectation-Maximization, EM) σε ένα μοντέλο μικτήςκατανομής πιθανότητας (probabilistic mixture model). Παραθέτουμε αποτελέσματα από την ε-φαρμογή του προτεινόμενου αλγορίθμου σε ένα πρόβλημα ισορροπίας κινούμενου ρομπότ.

Available Files

Services

Statistics