Streaming, high performance support vector methodsStreaming, high performance support vector methodsΥψηλής απόδοσης μέθοδοι διανυσμάτων υποστήριξης σε ροές δεδομένων Διπλωματική Εργασία Diploma Work 2016-08-302016enWe are in an era where data are constantly being generated and machine learning can benefit from this to produce better models. Support vector machines are a popular machine learning model, which can be adapted and used for various tasks, such as classification, regression and clustering. We study the problem of continuously updating L2 Support Vector Machines in a distributed environment where new data constantly arrive in remote sites. We approach this as the problem of tracking a convex function’s minimum over the convex hull of the union of fully dynamic sets, each one located in one of the sites. We give communication efficient solutions for both the exact and approximate variants of the problem and show that they are applicable in the case of a kernelized SVM trained in an explicit feature space. In our proposed methods, the sites communicate only when it is necessary, that is, every time the model has been truly outdated. Also, in case the sites are forced to communicate, we propose two algorithms, one iterative and one with a single stage of communication.Ζούμε σε μια εποχή όπου δεδομένα δημιουργούνται συνεχώς και η μηχανική μάθηση μπορεί να τα χρησιμοποιήσει για να παράγει καλύτερα μοντέλα. Οι μηχανές διανυσμάτων υποστήριξης (SVMs) είναι ένα δημοφιλές μοντέλο το οποίο μπορεί να προσαρμοστεί και να χρησιμοποιηθεί για διάφορες χρήσεις, όπως για ταξινόμηση, παρεµβολή και ομαδοποίηση. Μελετάμε το πρόβλημα ταυ να ενημερώνουμε συνεχόμενα L2 SVMS σε ένα κατανεμημένο περιβάλλον όπου νέα δεδομένα φτάνουν συνεχώς σε απομακρυσμένους κόμβους. Προσεγγίζουμε το πρόβλημα ως παρακολούθηση του ελαχίστου μίας κυρτής συνάρτησης πάνω στην κυρτή θήκη της ένωσης πλήρως δυναμικών συνόλων, που κάθε ένα από τα οποία βρίσκεται σε έναν από τους κόμβους. Δίνουμε επικοινωνιακά αποτελεσματικές λύσεις για την ακριβή και την προσεγγιστική λύση του προβλήματος και δείχνουμε ότι είναι εφαρμόσημες στην περίπτωση που οι SVM με πυρήνα και εκπαιδεύονται σε έναν υπονοούμενο χώρο. Οι μέθοδοι μας, επικοινωνούν μόνο όταν είναι απαραίτητο, δηλαδή κάθε φορά που το μοντέλο είναι πραγματικά μη ενημερωμένο. Επίσης, στην περίπτωση που χρειάζεται να επικοινωνήσουν, προτείνουμε δυο αλγόριθμους, ένα επαναληπτικό και με ένα στάδιο επικοινωνίας.http://creativecommons.org/licenses/by/4.0/Πολυτεχνείο Κρήτης::Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών ΥπολογιστώνChrysogelos_Periklis_Dip_2016.pdfChania [Greece]Library of TUC2016-08-30application/pdf268.8 kBfree Chrysogelos Periklis Χρυσογελος Περικλης Garofalakis Minos Γαροφαλακης Μινως Samoladas Vasilis Σαμολαδας Βασιλης Deligiannakis Antonios Δεληγιαννακης Αντωνιος Πολυτεχνείο Κρήτης Technical University of Crete Data mining Computational geometry Distributed algorithms