Institutional Repository
Technical University of Crete
EN  |  EL

Search

Browse

My Space

Music generation with Neural Networks

Papadopoulos Argyris

Simple record


URIhttp://purl.tuc.gr/dl/dias/080B1644-376C-4C97-89D4-64A6A6FB51FD-
Identifierhttps://doi.org/10.26233/heallink.tuc.91691-
Languageen-
Extent3.6 megabytesen
Extent100 pagesen
TitleMusic generation with Neural Networks en
TitleΔημιουργία μουσικής με χρήση Νευρωνικών Δικτύωνel
CreatorPapadopoulos Argyrisen
CreatorΠαπαδοπουλος Αργυρηςel
Contributor [Thesis Supervisor]Lagoudakis Michailen
Contributor [Thesis Supervisor]Λαγουδακης Μιχαηλel
Contributor [Committee Member]Chalkiadakis Georgiosen
Contributor [Committee Member]Χαλκιαδακης Γεωργιοςel
Contributor [Committee Member]Petrakis Evripidisen
Contributor [Committee Member]Πετρακης Ευριπιδηςel
PublisherΠολυτεχνείο Κρήτηςel
PublisherTechnical University of Creteen
Academic UnitTechnical University of Crete::School of Electrical and Computer Engineeringen
Academic UnitΠολυτεχνείο Κρήτης::Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστώνel
Content SummaryMachine Learning has been used in many applications in recent years and has produced impressive results. Interestingly, beyond well-known problems of academic, research or commercial interest, machine learning techniques are finding more and more their way into the area of arts, in the sense of generative modeling. In this thesis, we explore how deep neural networks can be used to automatically generate musical sequences. The goal of this work is to construct models that are able to learn the basic patterns of an input dataset (corresponding to a specific music genre) and try to replicate these patterns embedded into new, original samples, under the assumption that modeling and sampling may be more effective in two-dimensional image representations. To this end, we utilize well-known machine learning generative models, namely Variational Autoencoders (VAEs) and Generative Adversarial Networks (GANs), and propose our own deep network architectures maintaining simplicity and low computational power and time requirements. The implemented models are trained using datasets of MIDI files, containing tunes from different music genres, which are first converted to two-dimensional images during preprocessing. After training at image level, the trained models generate new images of a similar kind, which are decoded back to MIDI tunes, following a reverse procedure, and thus to music. MIDI files are ideal for our purposes due to their discrete nature, which facilitates the conversion to images back and forth. In the course of this work, we focused on data engineering issues, namely how to shape and form data in a way that helps our generative models learn easier and faster. We also offer a comparison of the different models and infer results on their effectiveness. The produced music tunes seem to resemble basic features of the original ones, but only in a few cases the outcome was truly interesting in terms of music theory. The proposed approach could potentially help musicians improve and explore original tunes based on preferred genres or types of music. Furthermore, our work can be used as a model for other learning tasks, not necessarily related to music, which may be facilitated, if explored through image representations, as we proposed. While our results do not generate consumer-grade music yet, our work represents a first step in the direction of automated music generation and computational creativity in general.en
Content SummaryΗ Μηχανική Μάθηση έχει χρησιμοποιηθεί σε πολλές εφαρμογές τα τελευταία χρόνια και έχει δώσει εντυπωσιακά αποτελέσματα. Είναι ενδιαφέρον ότι πέρα από τα γνωστά προβλήματα ακαδημαϊκού, ερευνητικού ή εμπορικού ενδιαφέροντος, οι τεχνικές μηχανικής μάθησης βρίσκουν όλο και περισσότερο τον δρόμο τους στον χώρο των τεχνών, με την έννοια της παραγωγικής μοντελοποίησης (generative modeling). Στην παρούσα διπλωματική εργασία, διερευνούμε πώς τα βαθιά νευρωνικά δίκτυα μπορούν να χρησιμοποιηθούν για την αυτόματη δημιουργία μουσικών ακολουθιών. Ο στόχος αυτής της εργασίας είναι η κατασκευή μοντέλων που μπορούν να μάθουν τα βασικά μοτίβα ενός συνόλου δεδομένων εισόδου (που αντιστοιχεί σε κάποιο είδος μουσικής) και να προσπαθήσουν να αναπαραγάγουν αυτά τα μοτίβα ενσωματωμένα σε νέα, πρωτότυπα δείγματα, με την υπόθεση ότι η μοντελοποίηση και η δειγματοληψία μπορεί να είναι πιο αποτελεσματική σε αναπαραστάσεις δισδιάστατων εικόνων. Για το σκοπό αυτό, χρησιμοποιούμε γνωστά μοντέλα μηχανικής μάθησης, συγκεκριμένα Variational Autoencoders (VAE) και Generative Adversarial Networks (GAN), και προτείνουμε τις δικές μας βαθιές αρχιτεκτονικές δικτύων που διατηρούν απλότητα και χαμηλές απαιτήσεις υπολογιστικής ισχύος και χρόνου. Τα μοντέλα που υλοποιήθηκαν εκπαιδεύονται χρησιμοποιώντας σύνολα δεδομένων αρχείων MIDI, που περιέχουν μελωδίες από διαφορετικά είδη μουσικής, τα οποία αρχικά μετατρέπονται σε δισδιάστατες εικόνες κατά την προεπεξεργασία. Μετά την εκπαίδευση σε επίπεδο εικόνας, τα εκπαιδευμένα μοντέλα παράγουν νέες εικόνες παρόμοιου είδους, οι οποίες αποκωδικοποιούνται σε μελωδίες MIDI, ακολουθώντας μια αντίστροφη διαδικασία, και συνεπώς σε μουσική. Τα αρχεία MIDI είναι ιδανικά για τους σκοπούς μας λόγω της διακριτής φύσης τους, η οποία διευκολύνει τη μετατροπή σε εικόνες εμπρός και πίσω. Κατά τη διάρκεια αυτής της εργασίας, εστιάσαμε σε ζητήματα επεξεργασίας δεδομένων, δηλαδή στον τρόπο διαμόρφωσης και στοίχισης δεδομένων, ώστε να βοηθά τα μοντέλα παραγωγής να μαθαίνουν ευκολότερα και γρηγορότερα. Προσφέρουμε επίσης μια σύγκριση των διαφορετικών μοντέλων και εξάγουμε συμπεράσματα σχετικά με την αποτελεσματικότητά τους. Οι μουσικές μελωδίες που παράγονται φαίνεται να προσομοιάζουν σε βασικά χαρακτηριστικά των αρχικών μελωδιών, αλλά μόνο σε λίγες περιπτώσεις το αποτέλεσμα ήταν πραγματικά ενδιαφέρον, όσον αφορά τη θεωρία της μουσικής. Η προτεινόμενη προσέγγιση θα μπορούσε ενδεχομένως να βοηθήσει τους μουσικούς να βελτιώσουν και να εξερευνήσουν πρωτότυπες μελωδίες με βάση τα προτιμώμενα είδη μουσικής. Επιπλέον, η εργασία μας μπορεί να χρησιμοποιηθεί ως πρότυπο για άλλα προβλήματα μηχανικής μάθησης, που δεν σχετίζονται απαραίτητα με τη μουσική, τα οποία μπορεί να διευκολυνθούν, εάν διερευνηθούν μέσω αναπαραστάσεων εικόνων, όπως προτείναμε. Αν και τα αποτελέσματά μας δεν παράγουν ακόμα μουσική καταναλωτικής ποιότητας, η δουλειά μας αντιπροσωπεύει ένα πρώτο βήμα προς την κατεύθυνση της αυτοματοποιημένης παραγωγής μουσικής και της υπολογιστικής δημιουργικότητας γενικότερα.el
Type of ItemΔιπλωματική Εργασίαel
Type of ItemDiploma Worken
Licensehttp://creativecommons.org/licenses/by/4.0/en
Date of Item2022-03-08-
Date of Publication2022-
SubjectDeep learningen
SubjectGenerative modelingen
Bibliographic CitationArgyris Papadopoulos, "Music generation with Neural Networks ", Diploma Work, School of Electrical and Computer Engineering, Technical University of Crete, Chania, Greece, 2022en
Bibliographic CitationΑργύρης Παπαδόπουλος, "Δημιουργία μουσικής με χρήση Νευρωνικών Δικτύων", Διπλωματική Εργασία, Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών, Πολυτεχνείο Κρήτης, Χανιά, Ελλάς, 2022el

Available Files

Services

Statistics