Computer Vision · T4

Von 2D zu 3D: Stereo und Tiefenrekonstruktion

Überblick

Dieses Thema erklärt, warum beim Abbilden von 3D auf 2D Tiefeninformation verloren geht, und wie durch Stereovision und epipolare Geometrie Tiefe rekonstruiert werden kann. Es gibt auch einen Überblick über verschiedene «Shape from X»-Methoden.

Relevanz: Einfache Rechenaufgaben zur Tiefe aus Disparität sind möglich. Epipolargeometrie konzeptionell, ohne Herleitung. Skizzen (Stereo-Setup, Epipolarlinien) sind prüfungsrelevant.

Kernkonzepte
  • Projektionsproblem (3D → 2D): Beim Abbilden einer 3D-Szene auf eine 2D-Bildebene geht die Tiefeninformation (Distanz zur Kamera) verloren. Ein kleines nahes und ein grosses weiter entferntes Objekt können das gleiche 2D-Bild erzeugen – das ist die Skalenmehrdeutigkeit (ill-posed problem).
  • Stereovision und Disparität: Zwei Kameras mit leicht versetztem Standpunkt beobachten die gleiche Szene. Die horizontale Verschiebung eines Punktes zwischen linkem und rechtem Bild heisst Disparität. Die Tiefe ist umgekehrt proportional zur Disparität: nahe Objekte haben grosse Disparität, ferne Objekte kleine.
  • Epipolargeometrie: Beschreibt die geometrische Beziehung zwischen zwei Kameras. Statt im gesamten Bild zu suchen, kann man den korrespondierenden Punkt eines Pixels auf eine Linie im anderen Bild (Epipolarlinie) einschränken, was die Suche erheblich beschleunigt.
Fachwörter & Glossar
  • Skalenmehrdeutigkeit (Scale Ambiguity)Das Problem, dass aus einem einzelnen 2D-Bild die absolute Grösse und Tiefe von Objekten nicht bestimmt werden kann, da unendlich viele 3D-Szenen dasselbe Bild erzeugen könnten.
  • DisparitätHorizontaler Pixelversatz eines Szenenpunktes zwischen linkem und rechtem Stereobild; ist umgekehrt proportional zur Tiefe des Punktes.
  • EpipolarlinieDie Linie im zweiten Bild eines Stereosystems, auf der der korrespondierende Punkt eines Pixels aus dem ersten Bild liegen muss; schränkt den Suchraum für Matching auf 1D ein.
  • EpipolDer Bildpunkt, in dem die Verbindungslinie der beiden Kamerazentren die Bildebene schneidet; Schnittpunkt aller Epipolarlinien eines Bildes.
  • EpipolargeometrieGeometrische Beziehung zwischen zwei Kameraansichten; beschreibt die Lage der Epipolarlinien und -pole und ist Grundlage für effizientes Stereo-Matching.
  • Shape from XSammelbegriff für Methoden zur 3D-Formrekonstruktion aus verschiedenen Quellen (X): Stereo (Disparität), Shading (Lichtintensität), Motion (Bewegung), Structured Light (Lichtmuster), Time-of-Flight (Laufzeit).
  • BaselineAbstand zwischen den Optikzentren der beiden Kameras eines Stereosystems; eine grössere Baseline erhöht die Tiefenauflösung für weiter entfernte Objekte.
  • Structure from Motion (SfM)Methode zur 3D-Rekonstruktion aus einer sich bewegenden (Einzel-)Kamera; nutzt viele Bilder aus verschiedenen Perspektiven. ---