Institutional Repository
Technical University of Crete
EN  |  EL

Search

Browse

My Space

Distributed and Online maintenance of graphical models in Apache Flink

Tzimos Nikolaos

Simple record


URIhttp://purl.tuc.gr/dl/dias/04F6F6AE-3D4E-4D06-8931-7ADE9256A61F-
Identifierhttps://doi.org/10.26233/heallink.tuc.95918-
Languageel-
Extent3.1 megabytesen
Extent103 σελίδεςel
TitleDistributed and Online maintenance of graphical models in Apache Flinken
TitleΚατανεμημένη και Online διατήρηση γραφικών μοντέλων στο Apache Flinkel
CreatorTzimos Nikolaosen
CreatorΤζημος Νικολαοςel
Contributor [Thesis Supervisor]Deligiannakis Antoniosen
Contributor [Thesis Supervisor]Δεληγιαννακης Αντωνιοςel
Contributor [Committee Member]Garofalakis Minosen
Contributor [Committee Member]Γαροφαλακης Μινωςel
Contributor [Committee Member]Samoladas Vasilisen
Contributor [Committee Member]Σαμολαδας Βασιληςel
PublisherΠολυτεχνείο Κρήτηςel
PublisherTechnical University of Creteen
Academic UnitTechnical University of Crete::School of Electrical and Computer Engineeringen
Academic UnitΠολυτεχνείο Κρήτης::Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστώνel
DescriptionΔιπλωματική Εργασία που υποβλήθηκε στη σχολή ΗΜΜΥ του Πολ. Κρήτης για την πλήρωση προϋποθέσεων λήψης του Προπτυχιακού Διπλώματος.el
Content SummaryΜε την αυξανόμενη ανάγκη για ανάλυση των δεδομένων σε μεγάλη κλίμακα, η κατανεμημένη μηχανική μάθηση έχει αποκτήσει σημασία τα τελευταία χρόνια. Τα δεδομένα συνήθως περιγράφονται από ένα μεγάλο αριθμό από αλληλοσχετιζόμενες μεταβλητές και μια σημαντική διεργασία είναι να μπορούμε να περιγράψουμε την από κοινού κατανομή όλων των μεταβλητών, επιτρέποντας την λήψη συμπερασμών και προβλέψεων. Ωστόσο η “απευθείας” μοντελοποίηση της από κοινού κατανομής όλων των μεταβλητών είναι μη εφικτή, αφού η πολυπλοκότητα ενός τέτοιου μοντέλου αυξάνεται εκθετικά με τον αριθμό των μεταβλητών. Εστιάζουμε στα Bayesian Networks , τα οποία αποτελούν τον “πατέρα” των γραφικών μοντέλων και παρουσιάζουμε μια διαφορετική προσέγγιση που είναι “επικοινωνιακά” αποδοτική χρησιμοποιώντας την ευρέως γνωστή μέθοδο του Functional Geometric Monitoring, για την συνεχή εκμάθηση και διατήρηση των Bayesian Networks πάνω σε κατανεμημένο περιβάλλον. Τέλος τα πειραματικά αποτελέσματα επιβεβαιώνουν την λειτουργικότητα την προτεινομένης προσέγγισης.el
Content SummaryWith the growing need for large scale data analysis, distributed machine learning has grown importance in recent years. The raw data is described by large number of interrelated variables and an important task is to describe the joint probability distribution over these variables, allowing simultaneously interferences and predications to be made. Directly modeling of joint probability distribution of all these variables may be infeasible, since the complexity of such model grown exponential with the number of variables. We focus on Bayesian Networks, the father of graphical models and present a different communication-efficient approach using the well-known method of Functional Geometric Monitoring, for continuously learning and maintenance of Bayesian Networks in a distributed streaming environment. Finally, the experimental results confirmed the functionality of proposed method.en
Type of ItemΔιπλωματική Εργασίαel
Type of ItemDiploma Worken
Licensehttp://creativecommons.org/licenses/by/4.0/en
Date of Item2023-05-16-
Date of Publication2023-
SubjectBayesian Networksen
SubjectNaive Bayes Classifiersen
SubjectFunctional Geometric Monitoringen
SubjectApproximate Distributed Countersen
SubjectMaximum Likelihood Estimateen
SubjectJoint Probability Distributionen
SubjectApache Flinken
Bibliographic CitationΝικόλαος Τζήμος, "Κατανεμημένη και Online διατήρηση γραφικών μοντέλων στο Apache Flink", Διπλωματική Εργασία, Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών, Πολυτεχνείο Κρήτης, Χανιά, Ελλάς, 2023el
Bibliographic CitationNikolaos Tzimos, "Distributed and Online maintenance of graphical models in Apache Flink", Diploma Work, School of Electrical and Computer Engineering, Technical University of Crete, Chania, Greece, 2023en

Available Files

Services

Statistics