Ιδρυματικό Αποθετήριο
Πολυτεχνείο Κρήτης
EN  |  EL

Αναζήτηση

Πλοήγηση

Ο Χώρος μου

Παραγωγή καταγραμμένης κίνησης από βίντεο με χρήση Νευρωνικών δικτύων

Christodoulidis Kyriakos

Απλή Εγγραφή


URIhttp://purl.tuc.gr/dl/dias/D8B034D2-F3EE-4A4E-8B25-1C4AFC513C6F-
Αναγνωριστικόhttps://doi.org/10.26233/heallink.tuc.93345-
Γλώσσαen-
Μέγεθος13.9 megabytesen
Μέγεθος85 pagesen
ΤίτλοςMotion capture generation from videos through Neural networksen
ΤίτλοςΠαραγωγή καταγραμμένης κίνησης από βίντεο με χρήση Νευρωνικών δικτύωνel
ΔημιουργόςChristodoulidis Kyriakosen
ΔημιουργόςΧριστοδουλιδης Κυριακοςel
Συντελεστής [Επιβλέπων Καθηγητής]Mania Aikaterinien
Συντελεστής [Επιβλέπων Καθηγητής]Μανια Αικατερινηel
Συντελεστής [Μέλος Εξεταστικής Επιτροπής]Chalkiadakis Georgiosen
Συντελεστής [Μέλος Εξεταστικής Επιτροπής]Χαλκιαδακης Γεωργιοςel
Συντελεστής [Μέλος Εξεταστικής Επιτροπής]Lagoudakis Michailen
Συντελεστής [Μέλος Εξεταστικής Επιτροπής]Λαγουδακης Μιχαηλel
ΕκδότηςΠολυτεχνείο Κρήτηςel
ΕκδότηςTechnical University of Creteen
Ακαδημαϊκή ΜονάδαTechnical University of Crete::School of Electrical and Computer Engineeringen
Ακαδημαϊκή ΜονάδαΠολυτεχνείο Κρήτης::Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστώνel
ΠεριγραφήΔιπλωματική Εργασίαel
ΠερίληψηMotion capture methods are either very expensive to acquire or of poor quality. Thus, we propose an innovative method that will give access to everyone who has an above-average computer, to generate for free their single-person digital motion clips. Recently, many researchers try to use neural networks that estimate the 3D human pose from a single video. In our approach, we decided to use three different well-known pre-trained models, the first two to find the 2D pose estimation from each frame of the video, and the other to convert these 2D poses into 3D poses. Then, we estimated the position of the human per frame, by calculating the depth of the person in the image. The combination of the 3D poses and the position consist the motion data that we wanted to find. Then, by importing these data into a Skeleton that contains all the estimated bones, we can create a Bio-vision Hierarchy (BVH) file, that can be imported into the 3D computer graphics software tool-set. At this point, the generated BVH file contains noise from the neural networks, so we propose using some filters to remove this noise without affecting significantly the motion data information. Furthermore, we converted the raw python code into a Windows Application to create a friendly user environment. Finally, we created some functions within this application so that the user can visually, process and edit the results from the BVH files.en
ΠερίληψηΟι μέθοδοι λήψης κίνησης είναι είτε πολύ δαπανηρές στην απόκτηση είτε χαμηλότερης ποιότητας. Έτσι, προτείνουμε μια καινοτόμο μέθοδο που θα δώσει πρόσβαση σε όλους όσους διαθέτουν έναν σχετικά καλό υπολογιστή, για να δημιουργήσουν δωρεάν τα ψηφιακά κλιπ κίνησης ενός ατόμου. Πρόσφατα, πολλοί ερευνητές προσπαθούν να χρησιμοποιήσουν νευρωνικά δίκτυα που θα εκτιμήσουν την τρισδιάστατη ανθρώπινη στάση από ένα μόνο βίντεο. Στην προσέγγισή μας, αποφασίσαμε να χρησιμοποιήσουμε τρία διαφορετικά γνωστά προ-εκπαιδευμένα μοντέλα, τα δύο πρώτα για να βρούμε την εκτίμηση 2D πόζας από κάθε καρέ του βίντεο και το άλλο για να μετατρέψουμε αυτές τις 2D στάσεις σε 3D πόζες. Στη συνέχεια, υπολογίσαμε τη θέση του ανθρώπου ανά καρέ, βρίσκοντας το βάθος του ατόμου στην εικόνα. Ο συνδυασμός των τρισδιάστατων στάσεων και της θέσης του ατόμου στο χώρο είναι τα δεδομένα κίνησης που θέλαμε να βρούμε. Στη συνέχεια, εισάγοντας αυτά τα δεδομένα σε έναν Σκελετό που περιέχει όλα τα εκτιμώμενα οστά, μπορούμε να δημιουργήσουμε ένα αρχείο Bio-vision Hierarchy (BVH), το οποίο μπορεί να εισαχθεί στο σε όλες τις εφαρμογές που επεξεργάζονται τρισδιάστατα γραφικά. Σε αυτό το σημείο, το αρχείο BVH που δημιουργείται περιέχει θόρυβο από τις εκτιμήσεως των νευρωνικών δικτύων, επομένως προτείνουμε τη χρήση ορισμένων φίλτρων για την αφαίρεση αυτού του θορύβου χωρίς να επηρεάζονται οι πληροφορίες δεδομένων κίνησης. Επιπλέον, μετατρέψαμε τον κώδικα python σε μια Windows εφαρμογή για να δημιουργήσουμε ένα πολύ πιο φιλικό περιβάλλον στο χρήστη. Τέλος, δημιουργήσαμε κάποιες λειτουργίες μέσα σε αυτήν την εφαρμογή ώστε ο χρήστης να μπορεί να απεικονίζει και να επεξεργάζεται τα αποτελέσματα από τα αρχεία BVH.el
ΤύποςΔιπλωματική Εργασίαel
ΤύποςDiploma Worken
Άδεια Χρήσηςhttp://creativecommons.org/licenses/by/4.0/en
Ημερομηνία2022-09-15-
Ημερομηνία Δημοσίευσης2022-
Θεματική ΚατηγορίαNeural Networksen
Θεματική ΚατηγορίαMotion Captureen
Βιβλιογραφική ΑναφοράKyriakos Christodoulidis, "Motion capture generation from videos through Neural networks", Diploma Work, School of Electrical and Computer Engineering, Technical University of Crete, Chania, Greece, 2022en
Βιβλιογραφική ΑναφοράΚυριάκος Χριστοδουλίδης, "Παραγωγή καταγραμμένης κίνησης από βίντεο με χρήση Νευρωνικών δικτύων", Διπλωματική Εργασία, Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών, Πολυτεχνείο Κρήτης, Χανιά, Ελλάς, 2022el

Διαθέσιμα αρχεία

Υπηρεσίες

Στατιστικά