URI | http://purl.tuc.gr/dl/dias/7B1432ED-164C-428C-B423-72C0D594D352 | - |
Αναγνωριστικό | https://doi.org/10.26233/heallink.tuc.65351 | - |
Γλώσσα | en | - |
Μέγεθος | 32,8 megabytes | en |
Τίτλος | Detection and semantic analysis of objects and events through visual cues | en |
Δημιουργός | Makantasis Konstantinos | en |
Δημιουργός | Μακαντασης Κωνσταντινος | el |
Συντελεστής [Επιβλέπων Καθηγητής] | Matsatsinis Nikolaos | en |
Συντελεστής [Επιβλέπων Καθηγητής] | Ματσατσινης Νικολαος | el |
Συντελεστής [Συν-Επιβλέπων] | Doulamis Anastasios | en |
Συντελεστής [Συν-Επιβλέπων] | Δουλαμης Αναστασιος | el |
Συντελεστής [Συν-Επιβλέπων] | Zervakis Michalis | en |
Συντελεστής [Συν-Επιβλέπων] | Ζερβακης Μιχαλης | el |
Συντελεστής [Μέλος Εξεταστικής Επιτροπής] | Tsafarakis Stelios | en |
Συντελεστής [Μέλος Εξεταστικής Επιτροπής] | Τσαφαρακης Στελιος | el |
Συντελεστής [Μέλος Εξεταστικής Επιτροπής] | Partsinevelos Panagiotis | en |
Συντελεστής [Μέλος Εξεταστικής Επιτροπής] | Παρτσινεβελος Παναγιωτης | el |
Συντελεστής [Μέλος Εξεταστικής Επιτροπής] | Tsapatsoulis, Nicolas | en |
Συντελεστής [Μέλος Εξεταστικής Επιτροπής] | Grammalidis, Nikos | en |
Εκδότης | Πολυτεχνείο Κρήτης | el |
Εκδότης | Technical University of Crete | en |
Ακαδημαϊκή Μονάδα | Technical University of Crete::School of Production Engineering and Management | en |
Ακαδημαϊκή Μονάδα | Πολυτεχνείο Κρήτης::Σχολή Μηχανικών Παραγωγής και Διοίκησης | el |
Περίληψη | This dissertation counts in total ten technical chapters, plus a conclusion chapter. Technical chapters are organized in three parts; each one of them is dedicated to a different aspect of semantic visual content analysis. The first part consists of four chapters and entitled ”From Objects to Events”. As the title suggests, in this part, we investigate how the information about objects in a scene can be available as a basis for event understanding. There are three different technical chapters, in which we try to address three different real-world problems; the development of (i) a supportive vision based system for detecting in real-time elderly and/or patients fall in indoor environments, (ii) a maritime security vision based system and (iii) a surveillance system for activity recognition in industrial workflow.
The second part entitled ”From Unstructured Visual Content to Objects”. In this part we investigate how the visual content that is stored in distributed and heterogeneous Internet databases can be, initially, organized, and then utilized towards objects documentation. Specifically, in this part we propose (i) a method for retrieving and dynamically clustering user generated photographs available over the web and (ii) and online image indexing scheme.
The third and last part entitled ”Beyond the Visual Spectrum” and focuses on visual content analysis using thermal and hyperspectral data. There are two technical chapters; the first one presents an algorithm for background subtraction applied on thermal video streams, while the second one presents a method for material recognition using hyperspectral images.
We approach each one of the aforementioned problems through the levels of understanding framework. Initially, we formulate in detail the problem at hand along with its constraints and specifications, explaining what computations will do and why they will do it. Then, we proceed with proposed solution design and implementation, where we describe in detail the tools for developing the proposed solutions, the input and output of the system as well as, all intermediate representations of visual information. Finally, we evaluate proposed solutions performance on both synthetic and real-world data. | en |
Περίληψη | Η συγκεκριμένη διδακτορική διατριβή αριθμεί δέκα τεχνικά κεφάλαια τα οποία οργανώνονται σε τρία διαφορετικά μέρη. Κάθε μέρος εστιάζει σε διαφορετικές πτυχές της σημασιολογικής ανάλυσης οπτικού περιεχομένου. Το πρώτο μέρος αποτελέιται από τέσσερα κεφάλαια και έχει το τίτλο «Από Αντικείμενα σε Γεγονότα». Αυτό το μέρος εστιάζει στην ανάλυση και ανάπτυξη τεχνικών για την αξιοποίηση της οπτικής πληροφορίας σε εικόνες και βίντεο με στόχο την ανίχνευση αντικειμένων. Επίσης εξετάζει πώς η πληροφορία για τα αντικείμενα μπορεί να χρησιμοποιηθεί ως βάση για την εξαγωγή συμπερασμάτων σχετικά με γεγονότα. Περιλαμβάνει τρία κεφάλαια στα οποία αναπτύσσονται τεχνικές μηχανική όρασης για την αντιμετώπιση τρίων πραγματικών προβλημάτων. Συγκεκριμένα, (α) αναπτύσσεται ένα σύστημα για την ανίχνευση ανθρωπίνων πτώσεων σε εσωτερικά περιβάλλοντα, (β) ένα σύστημα επιτήρησης παράκτιων περιοχών και (γ) ένα σύστημα αναγνώρισης ανθρώπινης δραστηριότητας σε βιομηχανικά περιβάλλοντα.
Το δεύτερο κεφάλαιο έχει τίτλο «Από Μη-δομημένα Δεδομένα σε Αντικέιμενα». Σε αυτό το μέρος (α) μελετώνται μέθοδοι για την επεξεργασία και αξιοποίηση οπτικής πληροφορίας εικόνων που είναι αποθηκευμένες σε ετερογενής βάσεις δεδομένων του διαδυκτίου και (β) αναπτύσσονται μέθοδοι για την οργάνωση της μη-δομημένης οπτκής πληροφορίας, η οποία χρησιμοποιείται για την τεκμηρίωση αντικειμένων ενδιαφέροντος.
Το τρίτο μέρος έχει τίτλο «Πέρα από το Οπτικό Φάσμα» και εστιάζει στην ανάλυση θερμικών και υποερφασματικών δεδομένων. Περιλαμβάνει δύο κεφάλαια. Το πρώτο παρουσιάζει έναν καινοτόμο αλγόριθμο για αφαίρεση φόντο λαμβάνοντας υπόψη τις ιδιαιτερότητες των θερμικών δεδομένων, ενώ το δεύτερο παρουσιάζει μια μέθοδο για την αναγνώριση υλικών μέσω επεξεργασίας υπερφασματικών δεδομένων.
Καθε ένα από τα παραπάνω προβλήματα προσεγγίζεται μέσα από το μεθοδολογικό πλάισιο εργασίας που έχει προταθέι από τον David Marr. Αρχικά ορίζεται το πρόβλημα που προσπαθούμε να λύσουμε, ποιοί είναι οι περιορισμοί και ποιές οι απαιτήσεις, εξηγούνται ποιοί υπολογισμοί θα πραγματοποιηθούν και για ποιο λόγο. Εν συνεχεία, σχεδιάζεται και υλοποιείται η μέθοδος επίλυσης του προβλήματος και περιγράφονται με λεπτομέρεια η ενδιάμεσες αναπαραστάσεις της οπτικής πληροφορίας, όπως επίσης η είσοδος και η έξοδος της μεθόδου. Τέλος, κάθε μέθοδος που προτείνεται αξιολογείται τόσο με συνθετικά όσο και με πραγματικά δεδομένα. | el |
Τύπος | Διδακτορική Διατριβή | el |
Τύπος | Doctoral Dissertation | en |
Άδεια Χρήσης | http://creativecommons.org/licenses/by/4.0/ | en |
Ημερομηνία | 2016-06-29 | - |
Ημερομηνία Δημοσίευσης | 2016 | - |
Θεματική Κατηγορία | Machine learning | en |
Θεματική Κατηγορία | Computer vision | en |
Βιβλιογραφική Αναφορά | Konstantinos Makantasis, "Detection and semantic analysis of objects and events through visual cues", Doctoral Dissertation, School of Production Engineering and Management, Technical University of Crete, Chania, Greece, 2016 | en |