Στόχος μας είναι να προτείνουμε ένα μοντέλο ροής εργασιών μεγάλων δεδομένων, εισάγοντας 3 καινοτόμες συνεισφορές στον τομέα των κατανεμημένων συνόψεων δεδομένων, της επεξεργασίας ροών και της μάθησης. Ξεκινάμε εισάγοντας την μέθοδο Reversible Random Hyperplane Projection (RRHP), μία καινοτόμα, υπολογιστικά φθηνή, αναστρέψιμη σύνοψη δεδομένων που μπορεί να χρησιμοποιηθεί για τη συμπίεση ροών δεδομένων σε περιβάλλοντα με περιορισμένους πόρους, όπως τα Ασύρματα Δίκτυα Αισθητήρων (ΑΔΑ). Κατά συνέπεια, το RRHP αποτελεί έναν αποδοτικό τρόπο συλλογής και μετάδοσης δεδομένων από το άκρο του δικτύου. Παρουσιάζουμε πειράματα σε πραγματικά περιβάλλοντα που αποδεικνύουν ότι το RRHP μπορεί να επιτύχει παρόμοιες ή καλύτερες μετρικές απόδοσης, σε σύγκριση με άλλους μηχανισμούς αναστρέψιμης σύνοψης δεδομένων, οι οποίοι μπορούν να αναπτυχθούν σε περιβάλλοντα ΑΔΑ. Επιπλέον, δείχνουμε ότι το RRHP μπορεί να παρατείνει τη διάρκεια ζωής των αισθητήρων στο πεδίο μειώνοντας την κατανάλωση ενέργειας τους έως και 10 φορές.Στη συνέχεια, παρουσιάζουμε το EVENFLOW, ένα καινοτόμο σύνολο πρωτοκόλλων συγχρονισμού για την παράλληλη ως προς τα δεδομένα εκπαίδευση νευρωνικών δικτύων σχεδιασμένο για περιβάλλον συστήματος Parameter Server, το οποίο επιτυγχάνει τόσο έγκαιρες όσο και ακριβείς ενημερώσεις του μοντέλου πρόβλεψης σε περιβάλλοντα ροών. Η πειραματική μας αξιολόγηση δείχνει ότι το EVENFLOW συνδυάζει τις αρετές και των δύο βασικών (σύγχρονο, ασύγχρονο) πρωτοκόλλων, προσφέροντας τους γρήγορους χρόνους εκπαίδευσης του ασύγχρονου πρωτοκόλλου, με σχεδόν ίση ή ακόμη και βελτιωμένη ακρίβεια σε σύγκριση με το σύγχρονο πρωτόκολλο. Κατά συνέπεια, το EVENFLOW μας επιτρέπει την εκπαίδευση στα δεδομένα που προέρχονται από το άκρο του δικτύου, με κατανεμημένο τρόπο.Τέλος, παρουσιάζουμε την κατανεμημένη πλατφόρμα Distribuito SuBiTO, μία έκδοση της αρχικής πλατφόρμας SuBiTO, η οποία εκτελεί δειγματοληψία, εκπαίδευση και πρόβλεψη με κατανεμημένο τρόπο, ενώ ταυτόχρονα βελτιστοποιεί συνεχώς τη στρατηγική νευρωνικής μάθησης. Η πλατφόρμα Distribuito SuBiTO διατηρεί την αρχική λειτουργία του SuBiTO, που μαθαίνει αυτόματα και συνεχώς, κατά τη διάρκεια εισροής νέων δεδομένων, βελτιστοποιώντας κάθε μέρος της επεξεργασίας και της μάθησης, προσαρμόζοντας τις παραμέτρους τους δυναμικά. Συνοδεύουμε τις συνεισφορές μας με εκτενή πειραματική αξιολόγηση, δοκιμάζοντας κάθε επανασχεδιασμένο μέρος της κατανεμημένης πλατφόρμας Distribuito SuBiTO και αποδεικνύοντας την αποτελεσματικότητά της στην επεξεργασία μεγάλου όγκου ροών, με αποδοτικό χαρακτήρα πραγματικού χρόνου, διατηρώντας παράλληλα τη λειτουργικότητα του αρχικού SuBiTO. Κατά συνέπεια, το Distribuito SuBiTO μας επιτρέπει να εκτελούμε αναλύσεις σε ροές μεγάλων δεδομένων που προέρχονται από το άκρο, με υψηλή προσαρμοστικότητα, σε πραγματικό χρόνο και με κατανεμημένο τρόπο.