Gabor-Filter
From Wikipedia, the free encyclopedia
Ein Gabor-Filter ist ein in der Bildverarbeitung und der Signalverarbeitung benutzter Filter. Er ist nach Dennis Gabor benannt, der ihn als 1D-Filter für die Signalverarbeitung vorschlug.[1] Das Gabor-Filter wurde von Gösta Granlund auf die Anwendung für 2D-Bilder verallgemeinert.[2] Das Gabor-Filter ist ein linearer Filter und wird vielfach als Vorverarbeitung zur Extraktion von Kanten und Linien in der Bildanalyse verwendet.[3]
In neurophysiologischen Untersuchungen konnte gezeigt werden, dass das Übertragungsverhalten des visuellen Systems höherer Lebewesen in einer bestimmten Verarbeitungsstufe, im Bereich der sogenannten einfachen Zellen, erstaunlich genau durch Gaborfunktionen modelliert werden kann.[4][5][6] Die zwei existierenden Theorien über das visuelle System, auf der einen Seite das Modell der lokalen rezeptiven Felder von Hubel und Wiesel[7] und auf der anderen Seite das visuelle System als Fourieranalysator[8] konnten durch dieses Modell erweitert und in gewisser Weise vereint werden.
Eine weitere wesentliche Eigenschaft der Gabor-Filter ergibt sich durch die spezielle Form der Filterfunktion. Gabor[1] konnte zeigen, dass die nach ihm benannten Elementarsignale die Unschärferelation der Informationstheorie durch ihr minimales „Zeit-Bandbreite-Produkt“ an der unteren Grenze erfüllen. Für die Bildverarbeitung ergibt sich hieraus die Möglichkeit, Bilder frequenzselektiv bei optimaler Auflösung im Orts- und Ortsfrequenzbereich zu filtern. Wird der Filter so eingestellt, dass die Filterübertragungsfunktion keinen Gleichanteil aufweist und für negative Frequenzen verschwindet, spricht man von einem Quadraturverhalten. Diesen Filtern kommt in der Stereobildverarbeitung eine besondere Rolle zu, da sich die lokalen Bildverschiebungen (Disparitäten), die zur Tiefenrekonstruktion verwendet werden, aus der Phaseninformation der Filterantworten ermitteln lässt.[9]
Definition

In der Signalverarbeitung kommen in Wesentlichen 1D und wie im Bereich der Bildsignalverarbeitung 2D Filter zum Einsatz. 2D-Garborfilter lassen sich wie folgt beschreiben: Wenn x=[x1 x2]T die Bildkoordinaten sind, dann ergibt sich die Impulsantwort g(x) eines Gabor-Filters in exponentieller Schreibweise zu:
Die Matrix A beschreibt hierbei die Form der Gauß'schen Einhüllenden des Filters.
Der Vektor k0 bestimmt die Bandbreite und die Orientierung des Filters in der Bildebene. Wird der Filter derart eingestellt, dass die Modulationsrichtung in eine der Achsen der Gauß'schen Einhüllenden (Matrix A) zeigt, mit:
ergibt sich eine Impulsantwort des Filters wie sie in der Abbildung dargestellt ist.[10]
Feature Extraktion aus Bildern


Eine Filterbank aus mehreren Gabor-Filtern mit unterschiedlichen Frequenzen und Orientierungen kann benutzt werden, um verschiedene Merkmale (Features) in einem Bild zu erkennen.[11]
Werden die Filter dabei in Oktaven mit logarithmisch zunehmender Bandbreite eingeteilt, ergibt sich eine Auflösungspyramide mit der sich Grob-Feinstrategien in der Bildverarbeitung realisieren lassen. Hierbei können die Filterergebnisse bei Einhaltung des Shannon-Abtasttheorems entsprechend komprimiert werden, um den Berechnungsaufwand der nachfolgenden Verarbeitungsschritte zu reduzieren.[10][3]
Die Übertragungsfunktion G(k) eines Gabor-Filters im (Orts-)Frequenzbereich (Fouriertransformation der Impulsantwort g(x)) ist definiert durch:
wobei k=[k1 k2]T der räumliche Frequenzvektor bzw. der Ortsfrequenzvektor ist. Soll nun das Eingangsbild mit N Filtern unterschiedlicher Auflösung in Form einer Oktavbandeinteilung gefiltert werden, können die Modulationsfrequenzen k0n wie folgt gewählt werden:
- ;
Die Filterergebnisse können anschließend mit dem Faktor 2n ohne Informationsverlust komprimiert werden.
Um gerichtete Informationen, wie Linien- oder Kantenverläufe aus Bilddaten zu extrahieren, können M 2D-Garbor-Filter mit unterschiedlichen Orientierungen und Modulationsfrequenzvektoren verwendet werden.
- ;
In der Stereobildverarbeitung bieten orientierungsselektive Gabor-Filter die Möglichkeit, gerichtete Intensitätsänderungen (z. B. Kanten- oder Linienstrukturen) orthogonal zur Stereobasis (im Stereonormalfall) aus den Bilddaten herauszufiltern, um die Robustheit bei der Zuordnung korrespondierender Bildbereiche zu erhöhen (siehe Korrespondenzproblem).[12]
In der Texterkennung sind Gabor-Filter geeignet, um Schriftzeichen in mehrsprachigen Dokumenten zu erkennen.[13] Gabor-Filter mit verschiedenen Frequenzen und Orientierungen können benutzt werden, um Textfelder aus komplexen ein- und mehrfarbigen Dokumenten-Scans zu extrahieren, da Text im Vergleich zu Bildern oder Zeichnungen mehr hochfrequente Anteile besitzt.[14][15] Weitere Anwendungen besitzt der Filter in der Emotionserkennung[16] und der Mustererkennung in der Medizin.[17] Weitere Anwendungsbereiche im Bereich Bilderkennung sind die Iris-Erkennung, die Erkennung von Fingerabdrücken und Landnutzungsklassifizierung von Satellitendaten.[18]