Computer Vision · T3

Geometrische Transformationen, Bildmerkmale und Stitching

Überblick

Dieses Thema behandelt die mathematische Beschreibung von Bildtransformationen, robuste Merkmalsextraktion (SIFT), das Prinzip der Ausreisserschätzung (RANSAC) sowie die vollständige Pipeline zur Erstellung von Panoramabildern (Image Stitching).

Relevanz: Abgrenzung der Transformationstypen und die vollständige Stitching-Pipeline (5 Schritte) müssen sicher beherrscht werden. RANSAC ohne Formeln, nur das Prinzip.

Kernkonzepte

Lineare, affine und projektive Transformationen: Lineare Transformationen (Rotation, Skalierung, Scherung) erhalten den Ursprung. Affine Transformationen (lineare + Translation) erhalten Parallelität von Linien, dargestellt als 3×3-Matrix mit letzter Zeile [0 0 1]. Projektive Transformationen (Homographien) erhalten nur Geradlinigkeit; die letzte Zeile der 3×3-Matrix ist frei.
RANSAC (Random Sample and Consensus): Iterativer Algorithmus zur robusten Schätzung eines Modells (z.B. Homographie) in Gegenwart von Ausreissern. Ablauf: (1) Minimale Punktmenge zufällig wählen, (2) Modell fitten, (3) Inlier zählen (Punkte die zum Modell passen), (4) Wiederholen und bestes Modell behalten.
Image Stitching Pipeline: (1) Feature-Detektion (z.B. SIFT), (2) Feature-Matching zwischen Bildern, (3) Homographie-Schätzung (mit RANSAC), (4) Warping (Bilder mittels Homographie transformieren), (5) Blending (Übergänge zwischen transformierten Bildern glätten).
SIFT-Invarianzen: SIFT-Features (Scale-Invariant Feature Transform) sind robust gegenüber Skalierungsänderungen, Rotationen und teilweise gegenüber Beleuchtungsänderungen. Kein Detail-Wissen zur Implementierung erforderlich.

Fachwörter & Glossar

HomographieProjektive 3×3-Transformationsmatrix, die eine planare Perspektivabbildung zwischen zwei Bildern beschreibt; Basis des Image Stitching.
RANSAC (Random Sample and Consensus)Iterativer Algorithmus zur robusten Schätzung eines Modells aus Daten mit Ausreissern (Outliers); wählt zufällig minimale Punktmengen und zählt Inlier.
Hough-TransformationMethode zur Detektion geometrischer Formen (Linien, Kreise) in Kantenbildern durch Abstimmung im Parameterraum.
SIFT (Scale-Invariant Feature Transform)Algorithmus zur Detektion und Beschreibung von Bildmerkmalen, der robust gegenüber Skalierung, Rotation und teilweise Beleuchtungsänderungen ist.
Feature-DetektionIdentifikation von markanten, eindeutigen Punkten (Keypoints) in einem Bild, die stabil unter verschiedenen Transformationen sind (Ecken, Blobs).
Feature-MatchingVerknüpfung von Keypoints aus verschiedenen Bildern anhand ihrer Deskriptoren (Merkmalsvektoren).
WarpingRäumliche Transformation eines Bildes mittels einer Transformationsmatrix (z.B. Homographie), um Perspektivverzerrungen zu korrigieren.
BlendingNahtloses Zusammenfügen mehrerer transformierter Bilder durch Überblendung der Übergänge.
KamerakalibrationBestimmung der intrinsischen Kameraparameter (Brennweite, Hauptpunkt, Linsenverzerrung) und extrinsischen Parameter (Position und Orientierung), z.B. mittels Schachbrettmuster. Notwendig für Stereo-Vision, AR und metrische 3D-Rekonstruktion.
Affine TransformationGeometrische Transformation, die Parallelität erhält; umfasst Translation, Rotation, Skalierung und Scherung; dargestellt als 3×3-Matrix mit letzter Zeile [0 0 1]. ---