Mitretodis Angelos, "Big Data Analysis with Applications to Crisis Management", Master Thesis, School of Production Engineering and Management, Technical University of Crete, Hellenic Army Academy, Chania, Greece, 2020
https://doi.org/10.26233/heallink.tuc.85713
Κατά τη διάρκεια κρίσεων όλοι οι εμπλεκόμενοι, όπως κυβερνήσεις, μέσα μαζικής επικοινωνίας, υπηρεσίες ασφαλείας, οργανισμοί βοήθειας κλπ, επιδιώκουν να φτάσουν όσο το δυνατόν ταχύτερα στην απόκτηση επίγνωσης της καταστάσεως (situation awareness). Για το σκοπό αυτό, απαιτείται αντίληψη, κατανόηση και ικανότητα προβλέψεων για την πορεία των πραγμάτων στο εγγύς μέλλον. Η απόκτηση της επίγνωσης της καταστάσεως είναι συλλογική διεργασία συγκέντρωσης πληροφοριών από συνδυασμό διαφορετικών πηγών. Η πληθώρα πληροφοριακών δικτύων που λειτουργούν σήμερα, όπως δίκτυα αισθητήρων, δίκτυα εποπτείας, κοινωνικά δίκτυα, διαδίκτυο κλπ, έχουν τη δύναμη να συμβάλουν σημαντικά προς την απόκτηση της ζητούμενης επίγνωσης. Ο όγκος και η πολυπλοκότητά των πηγών αυτών καθιστούν δύσκολη ή ανέφικτη την απευθείας χρήση τους από τους ενδιαφερόμενους. Υπολογιστικά συστήματα μπορούν να συμβάλλουν με πολλαπλούς τρόπους στην ανταπόκριση σε κρίσεις. Παραδείγματα είναι η επεξεργασία μοντέλων, η προσομοίωση, η πρόβλεψη της πορείας δεικτών, η εκτίμηση κινδύνου κλπ. Όλες αυτές οι μορφές επεξεργασίας αποδίδονται στη βιβλιογραφία ως «Πληροφορική Κρίσεων». Ο όρος αυτός περιλαμβάνει τη μελέτη τεχνολογιών πληροφορικής και επικοινωνιών σε σχέση με προηγούμενες ή πιθανές μαζικές καταστάσεις εκτάκτου ανάγκης με έμφαση στις κοινωνικές συνέπειες (θετικές και αρνητικές) της μαζικής επεξεργασίας δεδομένων σχετικών με τις καταστάσεις αυτές. Στην παρούσα εργασία, θα μελετηθούν και αναλυθούν υπολογιστικές τεχνικές για την επεξεργασία ελευθέρου κειμένου που είναι ελεύθερα διαθέσιμο στο διαδίκτυο, με στόχο την εξαγωγή της απαιτούμενης πληροφορίας. Οι τεχνικές αυτές περιλαμβάνουν επεξεργασία φυσικής γλώσσας, εξόρυξη δεδομένων, μηχανική μάθηση, ανάλυση συναισθημάτων καθώς και διεπαφή ανθρώπου – χρήστη και κατάλληλες μεθόδους οπτικοποίησης. Το επιπλέον ζητούμενο στη συγκεκριμένη περίπτωση είναι αλγόριθμοι, οι οποίοι να μπορούν σε συγκεκριμένη χρονική διορία να ανταπεξέρχονται στον παρουσιαζόμενο όγκο δεδομένων. Θα μελετηθούν τεχνικές συλλογής, αποθήκευσης, αναζήτησης, συγχώνευσης διαφορετικών πηγών των δεδομένων. Για τη μελέτη θα χρησιμοποιηθούν ως παράδειγμα τα δημοσίως διαθέσιμα δεδομένα του Twitter. Τέλος προτείνεται η αξιοποίηση των χρησιμοποιούμενων τεχνικών για την ανάπτυξη ενός μηχανισμού υποστήριξης λήψης αποφάσεων από οποιαδήποτε οργανισμό.