URI | http://purl.tuc.gr/dl/dias/F6CCE2BB-554D-4944-8E06-5F9EC32D9694 | - |
Αναγνωριστικό | https://doi.org/10.26233/heallink.tuc.68543 | - |
Γλώσσα | el | - |
Μέγεθος | 62 σελίδες | el |
Τίτλος | Συστηματική αναζήτηση και ενισχυτική μάθηση για το επιτραπέζιο παιχνίδι "Amazons" | el |
Τίτλος | Systematic search and reinforcement learning for the "Amazons" board game | en |
Δημιουργός | Konstantakis Georgios | en |
Δημιουργός | Κωνσταντακης Γεωργιος | el |
Συντελεστής [Επιβλέπων Καθηγητής] | Lagoudakis Michael | en |
Συντελεστής [Επιβλέπων Καθηγητής] | Λαγουδακης Μιχαηλ | el |
Συντελεστής [Μέλος Εξεταστικής Επιτροπής] | Deligiannakis Antonios | en |
Συντελεστής [Μέλος Εξεταστικής Επιτροπής] | Δεληγιαννακης Αντωνιος | el |
Συντελεστής [Μέλος Εξεταστικής Επιτροπής] | Chalkiadakis Georgios | en |
Συντελεστής [Μέλος Εξεταστικής Επιτροπής] | Χαλκιαδακης Γεωργιος | el |
Εκδότης | Πολυτεχνείο Κρήτης | el |
Εκδότης | Technical University of Crete | en |
Ακαδημαϊκή Μονάδα | Technical University of Crete::School of Electrical and Computer Engineering | en |
Ακαδημαϊκή Μονάδα | Πολυτεχνείο Κρήτης::Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών | el |
Περίληψη | Τα παιχνίδια αποτελούσαν πάντα ένα πολύτιμο κομμάτι της έρευνας στον τομέα της Τεχνητής Νοημοσύνης και της Μηχανικής Μάθησης λόγω των υψηλών δεξιοτήτων που απαιτούν. Η παρούσα διπλωματική εργασία επικεντρώνεται στο επιτραπέζιο παιχνίδι Amazons, το οποίο τα τελευταία χρόνια έχει αρχίσει να προσελκύει ερευνητές του τομέα της Τεχνητής Νοημοσύνης και της Μηχανικής Μάθησης. Το Amazons είναι ένα παιχνίδι σκακιέρας που παίζεται από δύο παίκτες με εναλλασσόμενες κινήσεις. Κάθε παίκτης χειρίζεται 4 πούλια που κινούνται όπως οι βασίλισσες στο σκάκι, αλλά μετά από κάθε κίνηση πρέπει να τοποθετηθεί κάποιο μόνιμο εμπόδιο σε κάποια θέση στην σκακιέρα βάσει των κανόνων του παιχνιδιού. Νικητής είναι ο παίκτης που θα παγιδεύσει τον αντίπαλό του, ώστε να μην μπορεί να κινηθεί. Χαρακτηριστικό του παιχνιδιού είναι ο μεγάλος αριθμός επιλογών σε κάθε κίνηση. Στόχος της εργασίας είναι ο σχεδιασμός ενός αυτόνομου πράκτορα, ο οποίος θα είναι ικανός να παίξει ανταγωνιστικά το παιχνίδι, αλλά και ένα παραμετροποιήσιμο γραφικό περιβάλλον, μέσω του οποίου μπορούν οπτικοποιηθούν και να διεξαχθούν παιχνίδια μεταξύ διαφόρων παικτών (πρακτόρων ή ανθρώπων). Η στρατηγική του πράκτορά μας για την επιλογή κινήσεων βασίζεται στον αλγόριθμο αναζήτησης MiniMax με α-β Pruning σε συνδυασμό με μια προσθήκη εμπνευσμένη από τον αλγόριθμο Monte Carlo Tree Search. Σημαντικό ρόλο στην αξιολόγηση κινήσεων έχει η συνάρτηση αξιολόγησης που σχεδιάστηκε, τα βάρη της οποίας προσαρμόζονται μέσω του αλγορίθμου ενισχυτικής μάθησης TD-Learning κατά την εκτέλεση πολλών επαναλήψεων του παιχνιδιού. Ο συνδυασμός των παραπάνω οδήγησε στην δημιουργία διάφορων αποδοτικών παικτών, οι οποίοι αξιολογήθηκαν στα πλαίσια ενός τουρνουά. | el |
Περίληψη | Games have always been a valuable subject of research in the fields of Artificial Intelligence and Machine Learning, because of the high level of sophistication they require. This thesis focuses on a board game called “Amazons”, which during the recent years has started attracting researchers from the field of Artificial Intelligence and Machine Learning. Amazons is a chess-board game played by two players taking alternating turns. Each player handles 4 checkers, whose movements are similar to the queen in chess, but after each move a permanent obstacle must be also placed on a chessboard position, according to the rules of the game. The player who will trap his opponent and will make him unable to move is the winner. Central feature of the game is the large number of choices that each player has at each turn. The goal of this thesis is to create an autonomous agent, which will be able to play this game competitively, but also to create a graphical environment, through which many games among different players (agents or people) can take place. Our agent’s strategy for choosing moves is based on the MiniMax search algorithm with alpha-beta Pruning, combined with an addition inspired by the Monte Carlo Tree Search Algorithm. An important role for the movements’ evaluation is the proposed evaluation function designed for the game, the weights of which are adapted through the reinforcement learning algorithm TD-Learning by repeatedly playing many games. The combination of the techniques mentioned above led to the creation of several efficient players who were evaluated through a tournament. | en |
Τύπος | Διπλωματική Εργασία | el |
Τύπος | Diploma Work | en |
Άδεια Χρήσης | http://creativecommons.org/licenses/by/4.0/ | en |
Ημερομηνία | 2017-07-06 | - |
Ημερομηνία Δημοσίευσης | 2017 | - |
Θεματική Κατηγορία | Artificial intelligence | en |
Θεματική Κατηγορία | Τεχνητή νοημοσύνη | el |
Βιβλιογραφική Αναφορά | Georgios Konstantakis, "Systematic search and reinforcement learning for the "Amazons" board game", Diploma Work, School of Electrical and Computer Engineering, Technical University of Crete, Chania, Greece, 2017 | en |
Βιβλιογραφική Αναφορά | Γεώργιος Κωνσταντάκης, "Συστηματική αναζήτηση και ενισχυτική μάθηση για το επιτραπέζιο παιχνίδι "Amazons"", Διπλωματική Εργασία, Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών, Πολυτεχνείο Κρήτης, Χανιά, Ελλάς, 2017 | el |