Institutional Repository
Technical University of Crete
EN  |  EL

Search

Browse

My Space

Collection and analysis of datasets for AI-Driven networking algorithms

Skoulas Georgios

Simple record


URIhttp://purl.tuc.gr/dl/dias/3DF484BB-0C1E-4E2E-8444-3A3A5EDAB431-
Identifierhttps://doi.org/10.26233/heallink.tuc.102387-
Languageen-
Extent84 pagesen
TitleCollection and analysis of datasets for AI-Driven networking algorithmsen
TitleΣυλλογή και ανάλυση σετ δεδομένων για αλγορίθμους δικτύων με χρήση μεθόδων τεχνητής νοημοσύνηςel
CreatorSkoulas Georgiosen
CreatorΣκουλας Γεωργιοςel
Contributor [Thesis Supervisor]Spyropoulos Thrasyvoulosen
Contributor [Thesis Supervisor]Σπυροπουλος Θρασυβουλοςel
Contributor [Committee Member]Karystinos Georgiosen
Contributor [Committee Member]Καρυστινος Γεωργιοςel
Contributor [Committee Member]Christopoulos Dionysiosen
Contributor [Committee Member]Χριστοπουλος Διονυσιοςel
PublisherΠολυτεχνείο Κρήτηςel
PublisherTechnical University of Creteen
Academic UnitTechnical University of Crete::School of Electrical and Computer Engineeringen
Academic UnitΠολυτεχνείο Κρήτης::Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστώνel
Content SummaryThe integration of artificial intelligence (AI) into networking systems has ushered in a new era of efficiency, scalability, and intelligence in managing modern communication infrastructures. However, the effectiveness of AI-driven networking algorithms is intrinsically tied to the quality and relevance of the datasets used for their development and evaluation. This thesis focuses on the collection, preprocessing, and analysis of datasets derived from diverse domains, including cloud computing, 4G networks, and online platforms like YouTube, to enable the design of advanced AI-driven algorithms. We present a comprehensive study of four key datasets: Helios and Philly, representing GPU-based cloud computing workloads, a 4G LTE dataset capturing cellular network performance under varying mobility conditions, and a YouTube dataset encompassing user engagement metrics. Each dataset is meticulously preprocessed and analyzed to address challenges such as non-stationarity, heavy-tailed distributions, and missing data. Time-series analysis techniques, including rolling mean, autocorrelation function (ACF), and the Augmented Dickey-Fuller (ADF) test, are applied to uncover statistical properties and enhance data suitability for predictive modeling. This work also demonstrates the practical applications of these datasets by developing predictive models using techniques such as ARIMA and neural networks. The models are evaluated for their ability to forecast key performance metrics, optimize resource allocation, and enhance the reliability of networking systems. Additionally, insights from the analysis inform strategies for improving system performance and developing error-resilient scheduling policies in GPU clusters and cellular networks. The findings of this thesis underscore the critical role of robust datasets in advancing AI-driven networking algorithms. By addressing the challenges of data collection and preprocessing and showcasing their potential in real-world scenarios, this work contributes to the foundation for future innovations in intelligent networking systems. en
Content SummaryΗ ενσωμάτωση της τεχνητής νοημοσύνης στα δικτυακά συστήματα έχει εγκαινιάσει μια νέα εποχή αποδοτικότητας, επεκτασιμότητας και ευφυΐας στη διαχείριση των σύγχρονων επικοινωνιακών υποδομών. Ωστόσο, η αποτελεσματικότητα των αλγορίθμων δικτύωσης που βασίζονται στην τεχνητή νοημοσύνη εξαρτάται άμεσα από την ποιότητα των δεδομένων που χρησιμοποιούνται για την ανάπτυξη και αξιολόγησή τους. Η παρούσα διπλωματική εργασία εστιάζει στη συλλογή, προεπεξεργασία και ανάλυση συνόλων δεδομένων από διάφορους τομείς, όπως το cloud computing, τα δίκτυα 4G και πλατφόρμες όπως το YouTube, με στόχο τον σχεδιασμό προηγμένων αλγορίθμων που βασίζονται στην τεχνητή νοημοσύνη. Παρουσιάζεται μια εκτενής μελέτη τεσσάρων βασικών συνόλων δεδομένων: Helios και Philly, τα οποία αντιπροσωπεύουν φόρτους εργασίας βασισμένους σε GPU στο cloud computing· ένα σύνολο δεδομένων 4G LTE που καταγράφει την απόδοση κυψελοειδών δικτύων υπό διάφορες συνθήκες κινητικότητας· και ένα σύνολο δεδομένων από το Youtube που περιλαμβάνει μετρήσεις αλληλεπίδρασης χρηστών. Κάθε σύνολο δεδομένων προεπεξεργάζεται και αναλύεται διεξοδικά για την αντιμετώπιση προκλήσεων, όπως η μη στασιμότητα, οι βαριές ουρές κατανομών και τα ελλιπή δεδομένα. Τεχνικές ανάλυσης χρονοσειρών, όπως η κυλιόμενη μέση τιμή, η συνάρτηση αυτοσυσχέτισης και το τεστ Augmented Dickey-Fuller (ADF), εφαρμόζονται για την εξαγωγή στατιστικών ιδιοτήτων και τη βελτίωση της καταλληλότητας των δεδομένων για μοντέλα προβλέψεων. Επιπλέον, η εργασία καταδεικνύει τις πρακτικές εφαρμογές αυτών των συνόλων δεδομένων μέσω της ανάπτυξης μοντέλων, όπως το ARIMA και τα νευρωνικά δίκτυα. Τα μοντέλα αξιολογούνται για την ικανότητά τους να προβλέπουν σύμφωνα με δείκτες απόδοσης, να βελτιστοποιούν την κατανομή πόρων και να ενισχύουν την αξιοπιστία των δικτυακών συστημάτων. Παράλληλα, οι γνώσεις που απορρέουν από την ανάλυση συμβάλλουν στη διαμόρφωση στρατηγικών βελτίωσης της απόδοσης συστημάτων και στην ανάπτυξη πολιτικών προγραμματισμού με αντοχή σε σφάλματα σε συμπλέγματα GPU και κυψελοειδή δίκτυα. Τα ευρήματα αυτής της διπλωματικής εργασίας αναδεικνύουν τον κρίσιμο ρόλο των αξιόπιστων συνόλων δεδομένων στην προώθηση των αλγορίθμων δικτύωσης που βασίζονται στην τεχνητής νοημοσύνης. Μέσα από την αντιμετώπιση προκλήσεων συλλογής και προεπεξεργασίας δεδομένων και την επίδειξη της χρησιμότητάς τους σε πραγματικά σενάρια, η παρούσα εργασία συνεισφέρει στις βάσεις για μελλοντικές καινοτομίες στα ευφυή δικτυακά συστήματα.el
Type of ItemΔιπλωματική Εργασίαel
Type of ItemDiploma Worken
Licensehttp://creativecommons.org/licenses/by/4.0/en
Date of Item2025-02-19-
Date of Publication2025-
SubjectWireless Networksen
SubjectAI-drivenen
SubjectCloud computingen
SubjectMachine learningen
Bibliographic CitationGeorgios Skoulas, "Collection and analysis of datasets for AI-Driven networking algorithms", Diploma Work, School of Electrical and Computer Engineering, Technical University of Crete, Chania, Greece, 2025en
Bibliographic CitationΓεώργιος Σκουλάς, "Συλλογή και ανάλυση σετ δεδομένων για αλγορίθμους δικτύων με χρήση μεθόδων τεχνητής νοημοσύνης", Διπλωματική Εργασία, Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών, Πολυτεχνείο Κρήτης, Χανιά, Ελλάς, 2025el

Available Files

Services

Statistics