2 Grundlagen
3 Bildverarbeitung
4 Fernerkundung u. GIS
5 Literatur
|
3.7 Klassifikationen Hintergrund Im Idealfall (!) ist jede Objektklasse durch eine ihr typische multispektrale Signatur im digitalen Bild gekennzeichnet. Diese Multispektralsignatur wird durch die statistische DN-Verteilung der Pixel einer jeden Klasse hervorgerufen, so daß man versuchen kann, mit Hilfe mathematischer Algorithmen die Pixel eines multispektralen Bildes im Hinblick auf ihre Homogenität sowie räumliche Verteilung (und damit die Verteilung von Objektklassen) zu untersuchen. Die mathematisch-statistische Analyse wird mit Hilfe von Klassifikatoren unüberwacht, selbständig (unsupervised) oder überwacht, interaktiv (supervised) am Rechner über alle verfügbaren Kanäle (Merkmalsraum) sowie deren Derivate (z.B. Ratios) durchgeführt; man spricht deshalb auch einer multispektralen Klassifikation digitaler Fernerkundungsdaten. Die Güte einer Klassifikation hängt dabei wesentlich davon ab, wie eindeutig die Multispektralsignatur jeder Objektklasse ist, wie stark die stichprobenhafte Geländekenntnis (ground truth) in einem Testgebiet mit den Ergebnissen der Klassifikation harmonisiert und mit welchem Typ von Klassifikatoren gearbeitet wird. Im Regelfall führen unüberwachte Klassifikationen von multispektralen Fernerkundungsdaten zu keinen befriedigenden Gesamtergebnissen, da kaum jede Objektklasse eindeutig im Bild gekennzeichnet ist (es resultieren häufig Mischpixel = Mixel = Fehlklassifikationen!). Deshalb setzt man überwiegend auf überwachte, interaktive Klassifikationsschritte, welche maßgeblich von den Interpreten gesteuert werden können und, gestützt durch individuelle Sach- bzw. Geländekenntnisse, deutlich bessere Klassifikationsergebnisse erbringen. Pixel- oder Spektralsignaturen oben Zur Veranschaulichung dieses Zusammenhanges soll im folgenden von einem zweidimensionalen Merkmalsraum (entsprechend zweier Kanäle) ausgegangen werden. Die Grauwerte einer bestimmten Objektklasse (z.B. Vegetation) unterscheiden sich fortlaufend von Kanal zu Kanal, obwohl es gewisse Ähnlichkeiten der DN-Werte in bestimmten Bandbreiten zu geben scheint (z.B. hohe Korrelationen innerhalb des VIS oder innerhalb des IR). Demzufolge unterscheiden sich auch die Pixelwolken in ihrer Eindeutigkeit, je nach Definition des Merkmalsraumes durch die jeweiligen Kanäle (Abb. 3.7.1).
Es wird deutlich, daß nur Kanalkombinationen für Klassifikationen günstig sind, die hinsichtlich der zu differenzierenden Objektklassen so wenig Mischpixel (Mixel) wie möglich aufweisen. Je größer die Schnittmenge im Merkmalsraum, desto uneindeutiger die Klassenzuweisung von Pixelgruppen! Dieser Sachzusammenhang stellt hinsichtlich der Klassifikationsbemühungen mehrerer Geo-Objektklassen auf der Basis nur eines multispektralen Bildes die Haupschwierigkeit dar, denn fast jede Objektklasse weist in den Originalkanälen neben uneinheitlichen interne Spektralsignaturen auch einen hohen Grad der Mixel-Bildung auf. Oft wird deshalb versucht, die einzelne Spektralsignatur durch den OIF, die Ratiobildung, eine HKA o.ä. deutlicher statistisch herauszuarbeiten, so daß die Eindeutigkeit der einzelnen Signaturen verbessert werden. Cluster-Analyse (unüberwachtes Klassifizierungsverfahren) oben Prinzipiell wird bei diesem Verfahren jedes einzelne Pixel auf seine spektrale Distanz zu einem Mittelwert einer zuvor über die statistischen Gesamtparameter definierten Gruppe von Klassen untersucht, wobei das Pixel jener Klasse zugeschlagen wird, zu der die geringste Distanz (Abweichung) besteht (Abb. 3.7.2). Die Bedeutung der Klassen ließe sich dann nachträglich (posteriori) auf ihre geowissenschaftliche Relevanz untersuchen. Meist führt diese Methode im Detail zu nur unzureichenden Ergebnissen; allerdings wird die Cluster-Analyse im Vorfeld der überwachten Klassifizierung als Beurteilungskriterium für die spektrale Homogenität der ausgewählten Trainingsgebiete bzgl. der Objektklasse oder evtl. möglicher Unterklassen genutzt, da sie nicht sehr rechnenaufwendig ist.
Minimum-Distance-Verfahren (überwachtes Klassifizierungsverfahren) oben Dabei werden zunächst für die Trainingsgebiete jeder Objektklasse die Mittelwerte der einzelnen Spektralkanäle berechnet (Abb. 3.7.3). Für jedes zu klassifizierende Bildelement berechnet man anschließend den Abstand zu den Mittelpunkten aller Klassen; das Pixel wird dann jener Klasse zugeteilt, zu deren Mittelpunkt der Abstand am geringsten ist (Richards, 1993; Haberäcker, 1987). Oft kommt es aber zu Fehlklassifikationen von Pixeln, da die spektrale Streuung innerhalb einer definierten Klasse im ausgewählten Testgebiet erfahrungsgemäß hoch ist. Da die Klassifikation jedoch überwacht durchgeführt wird, kann nun interaktiv die Wahl des Trainingsgebietes oder die Änderung der Bandkombination eine Verbesserung in der Klassifikation erbringen. Grundsätzlich werden immer alle Pixel irgend einer Klasse zugeordnet.
Parallelepiped-Verfahren (überwachtes Klassifizierungsverfahren) oben Dabei werden zunächst für die Trainingsgebiete jeder Objektklasse die obere und untere Spektralgrenze (meist +/- 2 x Standardabweichung) über die interaktive Auswahl der Trainingsgebiete definiert (im zweidimensionalen Raum also Rechtecke bzw. 3D als Quader). Alle Pixel werden nun entsprechend der Eckdaten der ausgewählten Objektklassen auf ihre mögliche Zugehörigkeit zu den verschiedenen Parallelepipeden geprüft. Pixel, welche in keine Klasse fallen bleiben unklassifiziert. Bei hoher Mixelrate müssen die einzelnen Quader in viele kleinere 'Boxen' zerlegt werden, damit die Pixelhaufen besser aufgelöst werden können (Abb. 3.7.4). Hier können Pixel auch unklassifiziert bleiben.
Maximum-Likelihood-Verfahren (überwachtes Klassifizierungsverfahren) oben Der Klassifikator berechnet aufgrund statistischer Kennwerte der interaktiv ausgewählten Trainingsgebiete (Pixelgruppen) die Wahrscheinlichkeiten, mit denen einzelne Pixel den Klassen angehören könnten. Dabei unterstellt man, daß die Pixelgruppen jeder Objektklasse im Merkmalsraum eine Normalverteilung um den jeweiligen Klassenmittelpunkt aufweisen. Zunächst werden so alle Pixel verschiedenen Klassen zugeordnet (mit Wahrscheinlichkeiten von [P] zwischen 100% u. 0%). Bei starker Korrelation innerhalb der Kanäle kommt es in einem zweiten Schritt dann zur Bildung von individuell definierten Ellipsoiden mit Ebenen gleicher Wahrscheinlichkeit (Rückweisungsschranken) für jede Klasse (Abb. 3.7.5), sogenannte Mahalanobis-Ellipsoide: Erst hier können Pixel auch unklassifiziert bleiben, sofern sie die 'Mindestwahrscheinlichkeit' nicht erreichen.
Hierachische Klassifikation (überwachtes Klassifizierungsverfahren) oben Dabei wird zunächst nur zwischen zwei bis drei Klassen unterschieden, welche dann wiederum in Einzelklassen zerlegt werden (Abb. 3.7.6). Dieses Verfahren ist generell sehr flexibel und für viele Klassifikationsansätze zu gebrauchen; allerdings erfordert die Aufschlüsselung in viele Klassenebenen ein hohes Maß an Systematik und Übersicht! Ein großer Vorteil dieses Klassifikationsansatzes liegt auch in der zielgerichteten Kanal- bzw. Komponentenauswahl für jeden einzelnen Zuweisungsschritt. So lassen sich unabhängig für jede Klassifikation Originalkanäle, Hauptkomponenten, Ratios etc. individuell auswählen. Der interaktive Arbeitsaufwand ist jedoch insgesamt deutlich höher, als bei den oben angesprochenen Verfahren.
Güte von pixelbasierten Klassifikationsergebnissen oben Zudem sind Inhomogenitäten in der Ausbildung einzelner Objektklassen der Regelfall: Weizenfelder sind unterschiedlich reif oder exponiert, Siedlungsräume individuell gestaltet, Wald- oder Moorflächen je nach Standort unterschiedlich entwickelt, Böden oder Gesteine unterschiedlich durchfeuchtet usw.. Ein wesentlicher Faktor der Mixel-Bildung ist auch der unterschiedliche Beleuchtungswinkel (morphologische Exposition der Objektklasse zum Sensor, also das Geländerelief!). So beinflussen Schattenwurf, wechselnde Reflexionsarten (total oder diffus) den resultierenden DN-Wert, obwohl keine materialspezifischen Variationen innerhalb der Objektklasse vorliegen.
Insgesamt unterliegt die Multispektral-Klassifizierung einer Vielzahl von störenden Einflüssen. Aus diesem Grunde verlangt die Anwendung der Methoden Sorgfalt, Sachkenntnis und viel Erfahrung! Bei der Interpretation und kartograpischen Umsetzung der Ergebnisse müssen die methodischen Grenzen des Verfahrens stets bedacht und einzelne Klassen individuell auf Basis unterschiedlicher Bildkomponenten erarbeitet werden!
Erweiterte Klassifikationsstrategien oben Weiterführende Klassifikationsansätze (z.B. objekt-orientiert) steigern die Güte einer Klassifikation durch den vermehrten Einsatz zusätzlicher Daten in Form 'künstlicher Kanäle' (Abb. 3.7.8) . Dabei fließen Informationen wie weitere Fernerkundungsdaten (z.B. Luftbilder), Geologie, DGM, Bodentyp, Niederschläge, Geometrie, Textur etc. in die Klassifizierung mit ein - der Merkmalsraum wird also signifikant erweitert.
Von zunehmender Bedeutung sind vor allem auch Texturparameter, welche über Algorithmen in die Klassifikation miteinbezogen werden. Dabei wird die Textur als typisches Muster einer Objektklasse definiert und können über Parameter wie Lebhaftigkeit, Stärke, Ausrichtung, Intensität u.ä. beschrieben sein (Rengers & Prinz, 2009). Auch spielt die multitemporale Betrachtung von Datensätzen (d.h. zu unterschiedlichen Zeitpunkten) ein wesentliche Rolle für die Ergebnisse einer Klassifikation. Werden hier starke zeitabhängige Variationen festgestellt, kann auch von einem Monitoring einer bestimmten Region gesprochen werden. Klassifikationsablauf unter ERDAS Imagine (Praktikum) oben
Objektorientiertes Klassifizieren (OBIA) oben vordefinierten Klassen (oder auch Subklassen) zuzuordnen um so 'Objekte' zu charakterisieren (Object Based Image Analysis = OBIA) . Grundlegend ist die Definition von Testobjekten (sog. sample objects, hier: Pixel oder Pixelgruppen!), welche zu einem hierachischen Verbund von Objektklassen zusammengeführt werden. Im gesamten Bild werden diese auf der Basis einer zuvor vorgenommenen Segmentierung abgegrenzt und statistisch verglichen. Ist ein Objekt erfolgreich klassifiziert, vererbt es seine Charakteristika (z.B. den Zuweisungsschlüssel) mittels Fuzzy-Logic oder Zusatzinformationen anderen Segmenten.
Basis der multivarianten Segmentation ist die Verfügbarkeit unterschiedlicher Informationsebenen (Layer), welche nicht nur aus FE-Daten, sondern auch aus anderen GIS-Graphikdaten bestehen können. Im gemeinsamen Datenpool werden kleinste gemeinsame Nenner gesucht, die dann schrittweise ein Flächenwachstum erfahren um Objekte zu bilden. Das Verschneiden (merge) von vielen kleineren Objekten zu einem großen Objekt gleicher Signatur wird schrittweise geprüft und realisiert (Abb. 3.7.11). In der Regel geht man von einen nur einem Pixel großen Nucleus aus, dessen Eigenschaften über Grauwertstatistik, Homogenität und Form im Wachstum kontrolliert werden (z.B. mittels heuristischer Optimierung).
Die eigentliche Klassifikation kann in zwei unterschiedlichen Varianten erfolgen (Abb. 3.7.12): I. Testklassen werden direkt über Pixelzuordnung bestimmt (sample based). Diese Methode ist einfach und erlaubt eine rasche interaktive Selektion von Objekten bzw. deren Interpolation über das ganze Bild II. Alle Objekte werden auf einer heterogenen Wissenbasis (knowledge base) definiert und im gesamten Bild mittels Vergleich von Eigenschaften sowie deren Vererbung miteinander verglichen und zu einer klassenspezifischen Kontextinformation verknüpft (class related features). Dies ist ein aufwendiges Verfahren mit jedoch guten Ergebnisse.
Die eigentliche 'sample based' Klassifikation erfolgt dann über die weitere Zuweisung von Objekten zu Klassen und deren Vergleich mit benachbarten Objekten hinsichtlich ihrer statischtischen Merkmale. Es resultieren Klassifikationen, die itterativ verbessert, d.h. um einzelne Segmente erweitert oder zu Hierachien modifiziert werden. Dabei ist die statistische Lage der Segmente (Klassenobjekte) im Merkmalsraum einer Klasse direkt einsehbar (Abb. 3.7.13).
Eine Optimierung der Testgebiete (sample objects) kann in der Regel einfach über den multivarianten Merkmalsraum erfolgen (Abb. 3.7.14). Hier werden die Klassen in ihrer relativen Lage gegenüber benachbarten Klassen abgebildet und erleichtern so das direkte Schätzen einer Signifikanz jedes repräsenativen Testgebietes für die jeweilige Klasse. Je weiter der Abstand der Objekte voneinander, desto weniger Unsicherheit ist in der späteren Klassifikation gegeben.
Eine weiter Optimierung der Testgebiete (sample objects) erfolgt über die Einbindung und Berücksichtigung der heterogenen Wissensbasis. So kann z.B. die Textur, Topologie, Form etc. eines jeden Testgebietes als weitere Charakteristik hinzugezogen werden und in der erneuten Klassifikation Berücksichtigung finden (Abb. 3.7.15). Die Authentizität der einbezogenen Charakteristika ist in Form der neuen Polygonbildung für jede Klasse direkt sichtbar.
Am Ende der multivarianten, objektorientierten Klassifikation steht also eine Zusammenstellung von Klassen, deren Charakteristika aus einer Vielzahl (idealerweise) einzigartiger, repräsentativen Eigenschaften steht. |