URI | http://purl.tuc.gr/dl/dias/6ABCFD10-5CD7-4AC5-9A3E-89A7EFCF3A28 | - |
Αναγνωριστικό | https://doi.org/10.26233/heallink.tuc.89437 | - |
Γλώσσα | en | - |
Μέγεθος | 62 pages | en |
Μέγεθος | 1.8 megabytes | en |
Τίτλος | Investigating behavioural and affective cloning via imitation and reinforcement learning | en |
Τίτλος | Διερεύνηση συμπεριφοριστικών και συναισθηματικών μοντέλων μέσω μίμησης και ενισχυτικής μάθησης | el |
Δημιουργός | Kapenekakis Antheas | en |
Δημιουργός | Καπενεκακης Ανθεας | el |
Συντελεστής [Επιβλέπων Καθηγητής] | Garofalakis Minos | en |
Συντελεστής [Επιβλέπων Καθηγητής] | Γαροφαλακης Μινως | el |
Συντελεστής [Μέλος Εξεταστικής Επιτροπής] | Lagoudakis Michail | en |
Συντελεστής [Μέλος Εξεταστικής Επιτροπής] | Λαγουδακης Μιχαηλ | el |
Συντελεστής [Μέλος Εξεταστικής Επιτροπής] | Yannakakis, Georgios N | en |
Εκδότης | Πολυτεχνείο Κρήτης | el |
Εκδότης | Technical University of Crete | en |
Ακαδημαϊκή Μονάδα | Πολυτεχνείο Κρήτης::Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών | el |
Περίληψη | In recent years, studying affect in computer-user interactions, video games, and even live streams has become increasingly popular. Objectively measuring the emotional experience of an audience has important implications in revenue generation and user retention. What has been relatively unstudied is user modeling by affect, especially in the context of video games. In this thesis, an initial framework and proof-of-concept for creating an affective agent is presented, which leverages user provided annotations to change agent behavior towards displaying a specific emotion, while trying to complete a behavioral objective.
To create this agent, a tool for sourcing annotations was created and used to form a dataset with affective annotations. Then, the dataset was tested for validity by running supervised learning experiments. Using a form of Deep Q Learning, along with the dataset, a set of agents was created with each having a different objective. A primary Reinforcement Learning agent focused on completing the environment and each of the rest focused on maximizing an emotion. Lastly, the set of agents was combined in a ratio to form composite agents that focused on both affect and behavior, with certain combinations being successful at both. | en |
Περίληψη | Τα τελευταία χρόνια, η έρευνα της συναισθηματικής εμπειρίας στις αλληλεπιδράσεις μεταξύ υπολογιστών-χρηστών, βιντεοπαιχνιδιών, ακόμη και livestream, γίνεται όλο και πιο επίκαιρη. Η αντικειμενική μέτρηση της συναισθηματικής εμπειρίας ενός κοινού έχει σημαντικές επιπτώσεις στα έσοδα μίας επιχείρησης και στη διατήρηση χρηστών. Ένα πεδίο που είναι σχετικά μη ερευνημένο είναι η μοντελοποίηση των χρηστών σε μία αλληλεπίδραση, ειδικά στο πλαίσιο των βιντεοπαιχνιδιών. Σε αυτή τη διπλωματική, παρουσιάζεται μία διαδικασία για τη δημιουργία ενός συναισθηματικού πράκτορα, η οποία αξιοποιεί συναισθηματικές παρατηρήσεις από χρήστες για να μεταποιήσει τη συμπεριφορά του πράκτορα ως προς την εμφάνιση ενός συγκεκριμένου συναισθήματος, ενώ ο πράκτορας προσπαθεί να ολοκληρώσει ένα στόχο.
Για την δημιουργία αυτού του πράκτορα, δημιουργήθηκε ένα εργαλείο για την άντληση σχολιασμών από εθελοντές και χρησιμοποιήθηκε για τη δημιουργία μίας βάσης δεδομένων με συναισθηματικούς σχολιασμούς. Στη συνέχεια, αυτή η βάση δοκιμάστηκε για εγκυρότητα εκτελώντας πειράματα supervised learning. Χρησιμοποιώντας μια μορφή του αλγορίθμου Deep Q Learning, μαζί με τα δεδομένα που συλλέχθηκαν, δημιουργήθηκε ένα σύνολο πρακτόρων, με τον κάθε έναν να έχει διαφορετικό στόχο. Ο πρωτεύων πράκτορας, μέσω Reinforcement Learning, επικεντρώθηκε στην ολοκλήρωση του στόχου στο περιβάλλον, ενώ οι υπόλοιποι επικεντρώθηκαν στη μεγιστοποίηση ενός συναισθήματος. Τελικά, το σύνολο των πρακτόρων συνδυάστηκε σε διάφορες αναλογίες για να σχηματιστούν σύνθετοι πράκτορες που επικεντρώνονταν το συναίσθημα όσο και στη συμπεριφορά, με ορισμένους συνδυασμούς να είναι επιτυχημένοι και στα δύο. | el |
Τύπος | Διπλωματική Εργασία | el |
Τύπος | Diploma Work | en |
Άδεια Χρήσης | http://creativecommons.org/licenses/by/4.0/ | en |
Ημερομηνία | 2021-06-23 | - |
Ημερομηνία Δημοσίευσης | 2021 | - |
Θεματική Κατηγορία | Ενισχυτική μάθηση | el |
Θεματική Κατηγορία | Reinforcement learning | en |
Θεματική Κατηγορία | Affective computing | en |
Θεματική Κατηγορία | Μηχανική μάθηση | el |
Θεματική Κατηγορία | Machine learning | en |
Βιβλιογραφική Αναφορά | Antheas Kapenekakis, "Investigating behavioural and affective cloning via imitation and reinforcement learning", Diploma Work, School of Electrical Engineering and Computer Engineering, Technical University of Crete, Chania, Greece, 2021 | el |
Βιβλιογραφική Αναφορά | Ανθέας Καπενεκάκης, "Διερεύνηση συμπεριφοριστικών και συναισθηματικών μοντέλων μέσω μίμησης και ενισχυτικής μάθησης", Διπλωματική Εργασία, Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών, Πολυτεχνείο Κρήτης, Χανιά, Ελλάς, 2021 | el |