Ιδρυματικό Αποθετήριο
Πολυτεχνείο Κρήτης
EN  |  EL

Αναζήτηση

Πλοήγηση

Ο Χώρος μου

Στατιστικές μέθοδοι για συστήματα φωνητικού διαλόγου

Georgiadou Despoina

Πλήρης Εγγραφή


URI: http://purl.tuc.gr/dl/dias/4190BB31-6107-4D32-8158-3471C4E3E01A
Έτος 2017
Τύπος Μεταπτυχιακή Διατριβή
Άδεια Χρήσης
Λεπτομέρειες
Εμφανίζεται στις Συλλογές

Περίληψη

Η αυτόματη κατανόηση της ομιλίας περιλαμβάνει μια σειρά από διαδικασίες. Ανάμεσα τους μία από τις κυριότερες και πιο δύσκολες είναι η εξαγωγή σημαντικής πληροφορίας (slot-filling). Τα τελευταία χρόνια, οι καλύτερες προσεγγίσεις σε αυτόν τον τομέα βασίζονται σε νευρωνικά δίκτυα με ανατροφοδότηση (RNNs). Ωστόσο, όταν χρησιμοποιούνται στην απλούστερη μορφή τους τα RNNs, δεν μπορούν να μάθουν αποδοτικά τις εξαρτήσεις που υπάρχουν σε μεγάλες χρονικά αποστάσεις στα δεδομένα. Σε αυτή την εργασία,προτείνουμε τη χρήση αρχιτεκτονικών ClockWork νευρωνικών δικτύων με ανατροφοδότηση (CW-RNN) για τη διαδικασία του slot-filling. Το CW-RNN είναι μια παραλλαγή της αρχιτεκτονικής RNN στην οποία εφαρμόζονται πολλαπλοί χρονισμοί στην ανατροφοδότηση συγκεκριμένων ομάδων από νευρώνες. Ηαρχιτεκτονική CW-RNN έχει αποδειχθεί ότι είναι πολύ αποδοτική παρότι διατηρεί σχετικά μικρή πολυπλοκότητα. Επιπλέον, το CW-RNN έχει εγγενώς πολύ μεγαλύτερη ικανότητα να μοντελοποιεί εξαρτήσεις σε χρονικά μεγάλες αποστάσεις. Για τα πειράματά μας με την αρχιτεκτονική CW-RNN επιλέξαμε τα δεδομένααναφοράς από το Air Travel Information System (ATIS). Παράλληλα προτείνουμε αρκετές καινοτόμες εκδοχές του CW-RNN και διαπιστώνουμε ότι υπερτερούν σημαντικά των απλών RNN αφού επιτυγχάνουν σημαντικά καλύτερα αποτελέσματα, διατηρώντας ταυτόχρονα μικρότερη πολυπλοκότητα.

Διαθέσιμα αρχεία

Υπηρεσίες

Στατιστικά