Institutional Repository
Technical University of Crete
EN  |  EL

Search

Browse

My Space

Ενισχυτική μάθηση ρομποτικού ελέγχου μέσω πιθανοτικού συμπερασμού

Vlassis Nikolaos, Kontes Georgios, Piperidis Savvas

Simple record


URIhttp://purl.tuc.gr/dl/dias/A14031E6-2685-4574-881F-77A04017278C-
Identifierhttp://www.robolab.tuc.gr/ASSETS/PAPERS_PDF/PAPERS_2009/HEROC_2009/022_Vlas_Kon_Pip.pdf-
Languageel-
Extent6 σελίδεςel
TitleΕνισχυτική μάθηση ρομποτικού ελέγχου μέσω πιθανοτικού συμπερασμούel
CreatorVlassis Nikolaosen
CreatorΒλασσης Νικολαοςel
CreatorKontes Georgiosen
CreatorΚοντες Γεωργιοςel
CreatorPiperidis Savvasen
CreatorΠιπεριδης Σαββαςel
Content SummaryΠαρουσιάζουμε μία νέα προσέγγιση στο πρόβλημα της αυτόματης μάθησης ρομποτικού ελέγ- χου με Ενισχυτική Μάθηση (Reinforcement Learning, RL). Πρόσφατες εργασίες στη βιβλιο- γραφία έχουν δείξει ότι ένα πρόβλημα Βέλτιστου Ελέγχου Διακριτού Χρόνου (Discrete Time Optimal Control) μπορεί να αναχθεί σε ένα πρόβλημα Πιθανοτικού Συμπερασμού (Probabilistic Inference) και να λυθεί με αντίστοιχες τεχνικές. Στην παρούσα εργασία δείχνουμε ότι μια τέτοια αναγωγή είναι επίσης δυνατή στην περίπτωση που το δυναμικό μοντέλου του συστήματος είναι άγνωστο, οπότε η μάθηση του ρομποτικού ελέγχου θα πρέπει να γίνει με μεθοδολογίες δοκιμής- και-σφάλματος (trial-and-error). Η ανάλυση που προτείνουμε οδηγεί σε ένα Monte-Carlo αλ- γόριθμο Προσδοκίας-Μεγιστοποίησης (Expectation-Maximization, EM) σε ένα μοντέλο μικτής κατανομής πιθανότητας (probabilistic mixture model). Παραθέτουμε αποτελέσματα από την ε- φαρμογή του προτεινόμενου αλγορίθμου σε ένα πρόβλημα ισορροπίας κινούμενου ρομπότ.el
Type of ItemΠλήρης Δημοσίευση σε Συνέδριοel
Type of ItemConference Full Paperen
Licensehttp://creativecommons.org/licenses/by/4.0/en
Date of Item2015-11-13-
Date of Publication2009-
SubjectIndustrial robotsen
Subjectrobots industrialen
Subjectindustrial robotsen
Bibliographic CitationΝ. Βλάσσης, Γ. Κόντες, Σ. Πιπερίδης, "Ενισχυτική Μάθηση Ρομποτικού Ελέγχου Μέσω Πιθανοτικού Συμπερασμού," στο 1ο Πανελλήνιο Συνέδριο Ρομποτικής, 23-24 Φεβρουαρίου, 2009.el

Available Files

Services

Statistics