Ιδρυματικό Αποθετήριο
Πολυτεχνείο Κρήτης
EN  |  EL

Αναζήτηση

Πλοήγηση

Ο Χώρος μου

Επιτάχυνση της συναισθηματικής ανάλυσης βασισμένη σε λεξικό με χρήση GPGPUs

Theodoraki Emmanouela

Πλήρης Εγγραφή


URI: http://purl.tuc.gr/dl/dias/A3990ECE-1406-416A-9F4E-C5469A70F59D
Έτος 2023
Τύπος Διπλωματική Εργασία
Άδεια Χρήσης
Λεπτομέρειες
Βιβλιογραφική Αναφορά Εμμανουέλα Θεοδωράκη, "Επιτάχυνση της συναισθηματικής ανάλυσης βασισμένη σε λεξικό με χρήση GPGPUs", Διπλωματική Εργασία, Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών, Πολυτεχνείο Κρήτης, Χανιά, Ελλάς, 2023 https://doi.org/10.26233/heallink.tuc.96456
Εμφανίζεται στις Συλλογές

Περίληψη

Η ανάλυση συναισθήματος (Sentiment Analysis - SA), είναι μια τεχνική επεξεργασίας φυσικής γλώσσας (NLP) που αναγνωρίζει υποκειμενικές πληροφορίες, όπως απόψεις και συναισθήματα σε περιεχόμενο κειμένου. Η ραγδαία ανάπτυξη των μέσων κοινωνικής δικτύωσης και ο μεγάλος όγκος περιεχομένου που παράγεται από τους χρήστες τους, έχει οδηγήσει την επιστημονική κοινότητα να αφιερώσει σημαντικό ποσοστό της έρευνας στην ανάπτυξη αποτελεσματικών τεχνικών ανάλυσης για το πεδίο αυτό. Επιπλέον, η ανάλυση συναισθήματος έχει ευρεία εφαρμογή σε πολλούς τομείς, όπως στο brand intelligence και στην έρευνα αγοράς, στις πολιτικές καμπάνιες, στο spam detection, κ.ά. Ο στόχος της παρούσας διπλωματικής εργασίας είναι η ανάπτυξη αλγορίθμων και εργαλείων που επιταχύνουν την ανάλυση συναισθήματος βασισμένη σε λεξικά χρησιμοποιώντας επεξεργαστές γενικού σκοπού (GPGPUs) και άλλους πολυπύρηνους επεξεργαστές. Για να το επιτύχουμε αυτό, σχεδιάζουμε και υλοποιούμε ένα σύστημα ανάλυσης συναισθήματος με παράλληλη επεξεργασία δεδομένων, το οποίο επεκτείνει υπάρχουσα μελέτη για παράλληλη αναζήτηση αλφαριθμητικών προτύπων, βασισμένη στον αλγόριθμο Aho-Corasick, χρησιμοποιώντας χιλιάδες blobs δεδομένων ως είσοδο, ταυτόχρονα. Το σύστημα αυτό, είναι ικανό να αναλύει μεγάλες ροές δεδομένων (π.χ. Twitter feeds) και να αναθέτει τα αντίστοιχα σκορ στο περιεχόμενο. Ακόμα, υλοποιούμε και επανασχεδιάζουμε τεχνικές SA που χρησιμοποιούνται σε δημοφιλή εργαλεία, όπως το Vader, με στόχο να παρέχουμε γρήγορα και ακριβή αποτελέσματα συναισθηματικής ανάλυσης. Επίσης, η κύρια μηχανή του συστήματός μας υλοποιείται με τη χρήση C/OpenCL, δίνοντας τη δυνατότητα να εκτελείται σε μεγάλη ποικιλία συσκευών. Η απόδοση του συστήματός μας αξιολογείται χρησιμοποιώντας ένα μεγάλο σύνολο κειμένων από Twitter feeds τα οποία αναφέρονται στην πανδημία COVID-19. Τέλος, συγκρίνουμε την προσέγγιση μας για ανάλυση συναισθήματος με τις προηγμένες λύσεις που υπάρχουν στη βιβλιογραφία, χρησιμοποιώντας τόσο αναλύσεις συναισθήματος που βασίζονται σε λεξικά (Lexicon-based), όσο και σε μηχανική μάθηση (Machine Learning – ML) και διαπιστώνουμε ότι η πρότασή μας μπορεί να τις ξεπεράσει σε υπολογιστική ταχύτητα κατά πολλές τάξεις μεγέθους, διατηρώντας την ίδια ακρίβεια. Αυτή η εργασία, παρέχει ένα γρήγορο και ακριβές εργαλείο ανάλυσης συναισθήματος το οποίο μπορεί να εκτελείται σε κοινά συστήματα γενικής χρήσης χωρίς τροποποιήσεις. Καταλήγοντας, το σύστημά μας λειτουργεί είτε ως ένα αυτόνομο εργαλείο είτε ως μία βιβλιοθήκη που μπορεί να ενσωματωθεί σε άλλες εφαρμογές, επιτρέποντας στους χρήστες να αποκτήσουν αποτελέσματα συναισθηματικής ανάλυσης σε σχεδόν πραγματικό χρόνο.

Διαθέσιμα αρχεία

Υπηρεσίες

Στατιστικά