Όραση Υπολογιστών (Computer Vision)
Εξάμηνο: Εαρινό
Στόχοι Μαθήματος
Εισαγωγή στην θεωρία των θεμελιωδών προβλημάτων της υπολογιστικής όρασης (computer vision), μαθηματικά μοντέλα και υπολογιστικοί αλγόριθμοι για την επίλυση τους, σύνοψη ενδείξεων από βιολογική και γνωστική όραση, και περιγραφή επιλεγμένων εφαρμογών.
Διδακτικό Προσωπικό
Διδάσκων:
- Καθ. Πέτρος Μαραγκός (Ιστοσελίδα)
Διδακτικοί Βοηθοί και Συνεργάτες:
- Π. Μέρμιγκας (p.mermigkas@gmail.com)
- Ν. Καρδαρης (nick.kardaris@gmail.com)
- Επιστημονικός Συνεργάτης: Δρ. Γιώργος Ρετσινάς (gretsinas@central.ntua.gr)
- Επιστημονική Συνεργάτις: Δρ. Νίκη Ευθυμίου (nefthymiou@central.ntua.gr)
- Επιστημονική Συνεργάτις: Δρ. Νάνσυ Ζλατίντση
Περιεχόμενα
- Σχηματισμός & φυσική εικόνων: Στοιχεία από Προοπτική Γεωμετρία, Ακτινομετρία-Φωτομετρία, Αισθητήρες, Σκίαση και 3Δ Ανακατασκευή, Χρώμα.
- Ανάλυση 2Δ/3Δ εικόνων.
- Σύντομη ανασκόπηση Γραμμικών Φίλτρων & Fourier Ανάλυσης με έμφαση σε φίλτρα Gabor και Wavelets.
- Μη-γραμμικά Φίλτρα και Τελεστές (μορφολογικά, τάξης, πλέγματος) για σχήματα και εικόνες: Αλγεβρική και Γεωμετρική ανάλυση.
- Aνάλυση εικόνων σε Πολλαπλές Κλίμακες και Πυραμίδες (Gaussian & Νonlinear Scale-spaces).
- Ανίχνευση Aκμών, γωνιών και άλλων γεωμετρικών χαρακτηριστικών (Feature detection).
- Ανάλυση Σχήματος: Καμπυλότητα, Μετασχηματισμοί απόστασης & σκελετού, Ιστογράμματα μεγέθους.
- Ανάλυση/μοντελοποίηση Υφής-texture: Textons, Gabor filterbanks, Fractals, Markov Τυχαία Πεδία.
- Κατάτμηση Εικόνων (Segmentation): Γεωμετρικές, Στατιστικές και Γραφικές Μέθοδοι.
- Ανίχνευση και Εκτίμηση 2Δ Οπτικής Ροής και 3Δ Κίνησης Οπτικών Αντικειμένων.
- Στερέοψη. Εκτίμηση 3Δ δομής-σχήματος.
- Ενεργές Καμπύλες (active contours). Εξέλιξη καμπυλών/επιφανειών με Μεθόδους Επιπεδοσυνόλων (Level Sets).
- Ανίχνευση και Αναγνώριση οπτικών αντικειμένων.
- Αναγνώριση δρασεων σε βίντεο.
- Σύντομη περιγραφή επιλεγμένων εφαρμογών, διάχυτη στα ανωτέρω θέματα.
Το εκπαιδευτικό υλικό της ιστοσελίδας μπορεί να χρησιμοποιηθεί ως βοήθημα από τους φοιτητές που έχουν εγγραφεί στο μάθημα ΟΡΑΣΗ ΥΠΟΛΟΓΙΣΤΩΝ και μόνο για τους σκοπούς του μαθήματος. Απαγορεύεται η ολική ή μερική αναπαραγωγή του ή η ανάρτησή του σε άλλη ιστοσελίδα ή η χρησιμοποίηση του για οποιοδήποτε άλλο σκοπό χωρίς την έγκριση του διδάσκοντος.
Κεφάλαια & Διαφάνειες
| Κεφάλαιο | Τίτλος | Κείμενο (PDF) | Διαφάνειες (PDF) |
|---|---|---|---|
| Τίτλος και Πίνακας Περιεχομένων | – | ||
| Chapter 1 | Εισαγωγή / Introduction | – | Διαφάνειες |
| Chapter 2 | Σχηματισμός Εικόνων: Προβολή, Φωτισμός, Αισθητήρες | Κείμενο | Διαφάνειες |
| Chapter 3 | Οπτικά Συστήματα και Κάμερες | Κείμενο | Διαφάνειες |
| Chapter 4 | Ακτινομετρία και Ανακατασκευή 3Δ σχήματος | Κείμενο | Διαφάνειες |
| Chapter 5 | Χρώμα / Color | Κείμενο | Διαφάνειες |
| Chapter 6 | Γραμμικοί Τελεστές Εικόνων | Κείμενο | Διαφάνειες |
| Chapter 7 | Δυαδικές Εικόνες και Τελεστές Συνόλων | Κείμενο | Διαφάνειες |
| Chapter 8 | Μορφολογικοί Τελεστές Γκρίζων Εικόνων | Κείμενο | Διαφάνειες |
| Chapter 9 | Τελεστές Πλέγματος για Εικόνες και Σχήματα | Κείμενο | Διαφάνειες |
| Chapter 10 | Ανίχνευση Χαρακτηριστικών | Κείμενο | Διαφάνειες |
| Chapter 11 | Ανάλυση Εικόνων σε Πολλαπλές Κλίμακες | Κείμενο | Διαφάνειες |
| Chapter 12 | Σχήμα / Shape | Κείμενο | Διαφάνειες |
| Chapter 13 | Υφή / Texture | Κείμενο | Διαφάνειες |
| Chapter 14 | Fractals | Κείμενο | Διαφάνειες |
| Chapter 15 | Κίνηση / Motion | Κείμενο | Διαφάνειες |
| Chapter 16 | Στερέοψη και Γεωμετρία Πολλαπλών Εικόνων | – | – |
| Chapter 17 | Ενεργά Περιγράμματα, Επιπεδοσύνολα και Μεταβολικές Μέθοδοι | Κείμενο | Διαφάνειες |
| Chapter 18 | Κατάτμηση / Segmentation | Κείμενο | Διαφάνειες |
| Chapter 19 | Αναγνώριση Αντικειμένων | Κείμενο | Διαφάνειες |
| Chapter 20 | Video Understanding: Action and Gesture Recognition | Κείμενο | Διαφάνειες |
| Appendix | Μαθηματικά Στοιχεία Συνόλων και Σημάτων Εικόνων | Κείμενο |
Συμπληρωματικό Υλικό
Βιβλιογραφία
- R. Haralick and L. Sapiro, Computer and Robot Vision, Volumes I & II, Addison-Wesley, 1992-93
- O. Faugeras, Three-Dimensional Computer Vision, MIT Press, 1993.
- D. Forsyth and J. Ponce, Computer Vision: A Modern Approach, 2003
- R. Szeliski, Computer Vision: Algorithms and Applications, Springer 2010. Available from here.
- O. Faugeras and Q.T. Luong, Geometry of Multiple Images, MIT Press, 2001
- R. Hartley and A. Zisserman, Multiple View Geometry, Cambridge Univ. Press, 2000, 2004. Available from here.
- D. Marr, Vision, W. Freeman & Co., New York, 1982
- B. Horn, Robot Vision, MIT Press, Cambridge, Massachusetts, 1986
- D. Hubel, Eye, Brain, and Vision, Scientific American Library, 1988. Available from here.
- K. Castleman, Digital Image Processing, Pentice-Hall, 1996