Computer Vision

Όραση Υπολογιστών (Computer Vision)

Εξάμηνο: Εαρινό

Στόχοι Μαθήματος

Εισαγωγή στην θεωρία των θεμελιωδών προβλημάτων της υπολογιστικής όρασης (computer vision), μαθηματικά μοντέλα και υπολογιστικοί αλγόριθμοι για την επίλυση τους, σύνοψη ενδείξεων από βιολογική και γνωστική όραση, και περιγραφή επιλεγμένων εφαρμογών.

Διδακτικό Προσωπικό

Διδάσκων:

Διδακτικοί Βοηθοί και Συνεργάτες:

  • Π. Μέρμιγκας (p.mermigkas@gmail.com)
  • Ν. Καρδαρης (nick.kardaris@gmail.com)
  • Επιστημονικός Συνεργάτης: Δρ. Γιώργος Ρετσινάς (gretsinas@central.ntua.gr)
  • Επιστημονική Συνεργάτις: Δρ. Νίκη Ευθυμίου (nefthymiou@central.ntua.gr)
  • Επιστημονική Συνεργάτις: Δρ. Νάνσυ Ζλατίντση

Περιεχόμενα

  • Σχηματισμός & φυσική εικόνων: Στοιχεία από Προοπτική Γεωμετρία, Ακτινομετρία-Φωτομετρία, Αισθητήρες, Σκίαση και 3Δ Ανακατασκευή, Χρώμα.
  • Ανάλυση 2Δ/3Δ εικόνων.
    • Σύντομη ανασκόπηση Γραμμικών Φίλτρων & Fourier Ανάλυσης με έμφαση σε φίλτρα Gabor και Wavelets.
    • Μη-γραμμικά Φίλτρα και Τελεστές (μορφολογικά, τάξης, πλέγματος) για σχήματα και εικόνες: Αλγεβρική και Γεωμετρική ανάλυση.
  • Aνάλυση εικόνων σε Πολλαπλές Κλίμακες και Πυραμίδες (Gaussian & Νonlinear Scale-spaces).
  • Ανίχνευση Aκμών, γωνιών και άλλων γεωμετρικών χαρακτηριστικών (Feature detection).
  • Ανάλυση Σχήματος: Καμπυλότητα, Μετασχηματισμοί απόστασης & σκελετού, Ιστογράμματα μεγέθους.
  • Ανάλυση/μοντελοποίηση Υφής-texture: Textons, Gabor filterbanks, Fractals, Markov Τυχαία Πεδία.
  • Κατάτμηση Εικόνων (Segmentation): Γεωμετρικές, Στατιστικές και Γραφικές Μέθοδοι.
  • Ανίχνευση και Εκτίμηση 2Δ Οπτικής Ροής και 3Δ Κίνησης Οπτικών Αντικειμένων.
  • Στερέοψη. Εκτίμηση 3Δ δομής-σχήματος.
  • Ενεργές Καμπύλες (active contours). Εξέλιξη καμπυλών/επιφανειών με Μεθόδους Επιπεδοσυνόλων (Level Sets).
  • Ανίχνευση και Αναγνώριση οπτικών αντικειμένων.
  • Αναγνώριση δρασεων σε βίντεο.
  • Σύντομη περιγραφή επιλεγμένων εφαρμογών, διάχυτη στα ανωτέρω θέματα.
Το εκπαιδευτικό υλικό της ιστοσελίδας μπορεί να χρησιμοποιηθεί ως βοήθημα από τους φοιτητές που έχουν εγγραφεί στο μάθημα ΟΡΑΣΗ ΥΠΟΛΟΓΙΣΤΩΝ και μόνο για τους σκοπούς του μαθήματος. Απαγορεύεται η ολική ή μερική αναπαραγωγή του ή η ανάρτησή του σε άλλη ιστοσελίδα ή η χρησιμοποίηση του για οποιοδήποτε άλλο σκοπό χωρίς την έγκριση του διδάσκοντος.

Κεφάλαια & Διαφάνειες

Κεφάλαιο Τίτλος Κείμενο (PDF) Διαφάνειες (PDF)
Τίτλος και Πίνακας Περιεχομένων
Chapter 1 Εισαγωγή / Introduction Διαφάνειες
Chapter 2 Σχηματισμός Εικόνων: Προβολή, Φωτισμός, Αισθητήρες Κείμενο Διαφάνειες
Chapter 3 Οπτικά Συστήματα και Κάμερες Κείμενο Διαφάνειες
Chapter 4 Ακτινομετρία και Ανακατασκευή 3Δ σχήματος Κείμενο Διαφάνειες
Chapter 5 Χρώμα / Color Κείμενο Διαφάνειες
Chapter 6 Γραμμικοί Τελεστές Εικόνων Κείμενο Διαφάνειες
Chapter 7 Δυαδικές Εικόνες και Τελεστές Συνόλων Κείμενο Διαφάνειες
Chapter 8 Μορφολογικοί Τελεστές Γκρίζων Εικόνων Κείμενο Διαφάνειες
Chapter 9 Τελεστές Πλέγματος για Εικόνες και Σχήματα Κείμενο Διαφάνειες
Chapter 10 Ανίχνευση Χαρακτηριστικών Κείμενο Διαφάνειες
Chapter 11 Ανάλυση Εικόνων σε Πολλαπλές Κλίμακες Κείμενο Διαφάνειες
Chapter 12 Σχήμα / Shape Κείμενο Διαφάνειες
Chapter 13 Υφή / Texture Κείμενο Διαφάνειες
Chapter 14 Fractals Κείμενο Διαφάνειες
Chapter 15 Κίνηση / Motion Κείμενο Διαφάνειες
Chapter 16 Στερέοψη και Γεωμετρία Πολλαπλών Εικόνων
Chapter 17 Ενεργά Περιγράμματα, Επιπεδοσύνολα και Μεταβολικές Μέθοδοι Κείμενο Διαφάνειες
Chapter 18 Κατάτμηση / Segmentation Κείμενο Διαφάνειες
Chapter 19 Αναγνώριση Αντικειμένων Κείμενο Διαφάνειες
Chapter 20 Video Understanding: Action and Gesture Recognition Κείμενο Διαφάνειες
Appendix Μαθηματικά Στοιχεία Συνόλων και Σημάτων Εικόνων Κείμενο

Συμπληρωματικό Υλικό

Βιβλιογραφία

  1. R. Haralick and L. Sapiro, Computer and Robot Vision, Volumes I & II, Addison-Wesley, 1992-93
  2. O. Faugeras, Three-Dimensional Computer Vision, MIT Press, 1993.
  3. D. Forsyth and J. Ponce, Computer Vision: A Modern Approach, 2003
  4. R. Szeliski, Computer Vision: Algorithms and Applications, Springer 2010. Available from here.
  5. O. Faugeras and Q.T. Luong, Geometry of Multiple Images, MIT Press, 2001
  6. R. Hartley and A. Zisserman, Multiple View Geometry, Cambridge Univ. Press, 2000, 2004. Available from here.
  7. D. Marr, Vision, W. Freeman & Co., New York, 1982
  8. B. Horn, Robot Vision, MIT Press, Cambridge, Massachusetts, 1986
  9. D. Hubel, Eye, Brain, and Vision, Scientific American Library, 1988. Available from here.
  10. K. Castleman, Digital Image Processing, Pentice-Hall, 1996
2025-11-26T12:50:46+00:00 May 15th, 2018|