Ιδρυματικό Αποθετήριο
Πολυτεχνείο Κρήτης
EN  |  EL

Αναζήτηση

Πλοήγηση

Ο Χώρος μου

Ηδονικά παίγνια στον πραγματικό κόσμο: μηχανική μάθηση και θεωρητικές επεκτάσεις

Georgara Athina

Πλήρης Εγγραφή


URI: http://purl.tuc.gr/dl/dias/43434C62-655A-4470-9722-67DF67C6CD73
Έτος 2019
Τύπος Μεταπτυχιακή Διατριβή
Άδεια Χρήσης
Λεπτομέρειες
Βιβλιογραφική Αναφορά Αθηνά Γεωργαρά, "Ηδονικά παίγνια στον πραγματικό κόσμο: μηχανική μάθηση και θεωρητικές επεκτάσεις", Μεταπτυχιακή Διατριβή, Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών, Πολυτεχνείο Κρήτης, Χανιά, Ελλάς, 2019 https://doi.org/10.26233/heallink.tuc.82823
Εμφανίζεται στις Συλλογές

Περίληψη

Παρά την ικανότητά της να μοντελοποιεί μαθηματικά σε ένα αφαιρετικό επίπεδο πραγματικά προβλήματα, η συνεργατική θεωρία παιγνίων συχνά υιοθετεί υποθέσεις που τελικά δεν ευσταθούν σε πραγματικά περιβάλλοντα. Με βάση τα παραπάνω, σε αυτήν την μεταπτυχιακή εργασία εστιάζουμε στα Ηδονικά Παίγνια--μια κλάση συνεργατικών παιγνίων στην οποία οι παίκτες σχηματίζουν συνασπισμούς με βάση προσωπικές προτιμήσεις που σχετίζονται με τους πιθανούς συμπαίκτες τους--και αναιρούμε κάποιες συνήθεις υποθέσεις, με στόχο να παρέχουμε ένα μοντέλο που περιγράφει ακριβέστερα τον πραγματικό κόσμο. Η εργασία μας προσέγγισε και επέκτεινε τα Ηδονικά Πάιγνια τόσο από θεωρητική όσο και από πρακτική σκοπιά, και κατέληξε σε ποικίλλες επιστημονικές συνεισφορές.Κατ' αρχάς, μια επικρατούσα υπόθεση στην βιβλιογραφία είναι ότι οι πράκτορες ενδιαφέρονται αποκλειστικά και μόνο για την σύνθεση του δικού τους συνασπισμού. Στην παρούσα εργασία, αφαιρούμε αυτόν την υπόθεση με το να επιτρέπουμε στους πράκτορες να αναπτύσσουν προτιμήσεις όχι μόνον σχετικά με συνασπισμούς, αλλά και σχετικά με δομές συνασπισμών--δηλαδή, διαμερίσεις του χώρου των πρακτόρων. Συγκεκριμένα, εισάγουμε έναν τυπικό ορισμό για τα ηδονικά παίγνια σε μορφή συνάρτησης διαμέρισης (PFF-HGs), και επεκτείνουμε γνωστές κλάσεις ηδονικών παιγνίων σε αυτή την μορφή.Μια άλλη υπόθεση που γίνεται συνήθως στα ηδονικά παίγνια, είναι αυτή της πλήρους πληροφόρησης. Ωστόσο, στον πραγματικό κόσμο αυτό δεν ισχύει σχεδόν ποτέ. Για να αντιμετωπίσουμε το θέμα, εξετάζουμε το πρόβλημα της αβεβαιότητας όσον αφορά κρυμμένες σχέσεις προτιμήσεων σε ηδονικά παίγνια. Συγκεκριμένα, υποθέτουμε ότι οι πράκτορες αλληλεπιδρούν σε ένα άγνωστο περιβάλλον ηδονικού παιγνίου, παρατηρούν ένα μικρό αριθμό από στιγμιότυπα, και προσπαθούν να μάθουν τις μή εμφανείς πτυχές του παιχνιδιού. Για το σκοπό αυτό, εφαρμόζουμε διάφορα μοντέλα επιβλεπόμενης και μή (μηχανικής) μάθησης, για να εξάγουμε προσεγγιστικά τις κρυφές σχέσεις προτιμήσεων και να ανιχνεύσουμε επιθυμητά μοτίβα συνεργασιών. Πιο συγκεκριμένα, παρέχουμε μια ενδελεχή αξιολόγηση με την χρήση γραμμικής παλινδρόμησης, παλινδρόμησης με συναρτήσεις βάσης, προωθητικών νευρωνικών δικτύων αλλά και του αλγορίθμου πιθανοτικής θεματικής μοντελοποίησης Latent Dirichlet Allocation (LDA), για την προσεγγιστική μάθηση των αγνώστων προτιμήσεων σε διάφορες κλάσεις ηδονικών παιγνίων.Τέλος, προτείνουμε και εισάγουμε την μελέτη μιας νέας κλάσης συνεργατικών παιγνίων, των Ηδονικών Παιγνίων Χρησιμότητας (HUGs), τα οποία λαμβάνουν υπ' όψιν τόσο ``ηδονικές΄΄ προτιμήσεις (σχετικές με τη σύνθεση της ομάδας), όσο και προτιμήσεις σχετιζόμενες με χρησιμότητα. Δίνουμε τον επίσημο ορισμό των HUGs, και επεκτείνουμε υπάρχουσες λύσεις ευστάθειας σε αυτά τα παίγνια. Εν συνεχεία, εισάγουμε μια καινούρια λύση ευστάθειας, την οποία καλούμε Μεμονωμένα Ορθολογικό - Μεμονωμένα Ευσταθές (IRIS) σημείο ισορροπίας, που σχεδιάστηκε ειδικά για τα παίγνια HUGs, και η οποία χαρακτηρίζει ευσταθείς δομές συνασπισμών σε αυτά τα παίγνια. Επιπροσθέτως, προτείνουμε ένα φυσικό μοντέλο ``τριχοτόμησης'' του χώρου των ηδονικών προτιμήσεων, μελετάμε συγκεκριμένες ιδιότητες των HUGs σε αυτό το μοντέλο, και το εκμεταλλευόμαστε ώστε να χαρακτηρίσουμε την εφικτότητα σχηματισμού συνασπισμών στα HUGs, και να υπολογίσουμε ένα πιθανοτικό άνω όριο για το ``κλάδεμα'' του χώρου συνασπισμών. Ως εκ τούτου, το κλάδεμα μπορεί να χρησιμοποιηθεί για να μειώσουμε το υπολογιστικό φορτίο για τον υπολογισμό κοινώς αποδεκτών από τους παίκτες (τεχνικά, ``ευσταθών στον πυρήνα kernel'') πληρωμών σε IRIS δομές συνασπισμών.

Διαθέσιμα αρχεία

Υπηρεσίες

Στατιστικά