Digitale Fernerkundung
5 Literatur
Version 2.1, 2017
Copyright by Dr. Torsten Prinz
Designed by Sabrina Handt, ZDM

4.1 Datenformate

Allgemeines
Für die Interaktion zwischen Fernerkundungsdaten und Geoinformationssystemen (GIS) ist die Kenntnis der Typenvielfalt möglicher Datenformate sehr wichtig. In Kapitel 3.1 wurden bereits Raster- und Vektordaten in ihrer grundlegenden Charakteristik erläutert. Neben diesen zweidimensionalen Daten werden vielfach auch punktuelle Sach- und Metadaten aus Datenbanken in einem GIS mit Fernerkundungsdaten verknüpft. Im Folgenden soll kurz über wichtigste Datenformate informiert werden (für weitere Details siehe auch ERDAS Import-/Exportoptionen).

Rasterdaten
Multispektrale Bildrasterdaten können auf unterschiedlichsten Medien (DVD, direct download, compressed archive fomats, wie z.B. geoTiffs, HDF, rar, zip etc.) gespeichert sein. Wichtiger als das Medium/Datenweg ist allerdings die zugrundeliegende Datenstruktur der Bilder.

Man unterscheidet drei wichtige binäre Formate (wobei die Pixelinformation 8, 11, 16 bit oder höher verschlüsselt werden). Typische 'Lagerungsformen' der multispektralen Daten sind...

- BIL (band interleaved by line)
- BSQ (band sequential, häufigste Variante)
- BIP (band interleaved by pixel)

(Beachte: Für einen panchromatischen, d.h. einkanaligen Datensatz sind diese Formate prinzipiell gleich! )

Das BIL-Format enthält die multispektrale Information eines jeden Kanals als unmittelbare Abfolge der jeweiligen Sensor-Scanreihen (rows) pro Spektralbereich (band). In Abbildung 4.1.1 wird diese Datenstruktur um die beiden Zusatzblöcke header (Kopf-Datei mit Zusatzinformationen) und trailer (End-Datei) erweitert. Diese beiden Ergänzungen sind optional und müssen (wenn vorhanden) bei dem Datenimport berücksichtigt werden (z.B. übersprungen werden = header bytes to skip: z.B. 128).

Abb. 4.1.1: Struktur von Fernerkundungsdaten im BIL-Format. Header- und trailer files sind optional (ERDAS, 1997)

 

Das häufig anzutreffende BSQ-Format zeichnet sich durch eine strikte Trennung der einzelnen, kompletten Bänder aus. Es besitzt den Vorteil, rasch einzelne Kanäle einlesbar und kombinierbar zu machen. Fast alle LANDSAT TM Daten sind im sogenannten fast-BSQ-Format abgelegt (Abb. 4.1.2).

Abb. 4.1.2: Struktur von Fernerkundungsdaten im fast-BSQ-format (hier: LANDSAT). Header- und trailer files sind optional (ERDAS, 1997)

Die obige Bild-Datenstruktur zeigt darüber hinaus folgende Charakteristika:

- ein end-of-file-marker (EOF) trennt jeden Bildatensatz vom Nächsten
- es gibt keine header-Datei vor jedem einzelnen Datensatz
- die Daten sind meist nicht 'geblockt', d.h. fließend binär einlesbar

Im BIP-Format liegt die Spektralinformation eines jeden Bandes als Abfolge gleicher Pixelkoordinaten vor; es ist somit dem BIL-Format recht ähnlich. Die Pixel sind sequentiell in einer großen Bild-Datei abgelegt (Abb. 4.1.3).

Abb. 4.1.3: Struktur von Fernerkundungsdaten im BIP-Format (ERDAS, 1997)

Alle Formate lassen sich ineinander konvertieren. Dies ist besonders für den erstmaligen Import von Datensätzen in ein Auswerte-Programm wichtig, da nicht alle Programme jedes Format lesen können. Neben den obigen Formaten existieren auch Rasterdaten-Formate wie z.B. *.gif, *.tif, *.pcx, *.bmp etc., die in der Bildverarbeitung wie 'einkanalige' Datensätze behandelt werden.

Die Größe einer Bilddatei ist für die Weiterverarbeitung in FE- oder GIS-Systemen oft ein limitierender Faktor, da Speicherplatz erfahrungsgemäß knapp ist. Im einfachsten Fall läßt sich die Größe einer Bilddatei wie folgt berechnen:

Zeilen x Spalten x Datentiefe [bit] x Kanäle = Größe Gesamtdatei in bytes!

Eine siebenkanalige TM-Subszene von 100 x 100 Pixeln (8 bit-kodiert) wäre demnach 70.000 byte bzw. 70 kbyte bzw. 0,07 Mbyte groß. Eine entsprechende Vollszene würde bereits bei 6500 x 7000 Zeile/Spalten ca. 320 Mbyte beanspruchen! Neben der 8-bit-Datentiefe können Fernerkundungsdaten (z.B. Radardaten) auch eine 4-bit, 16-bit oder 32-bit Datentiefe aufweisen; entsprechend verringern oder erhöhen sich die benötigten Speicherkapazitäten.

Mit zunehmender Grösse der Daten finden intelligente Komprimierungsstrategien (Pyramiden Layer, spektrale Kompressionen usw. ) bzw. Formate Anwendung (z.B. Hierarchical Data Format = HDF oder Enhanced Compressed Wavelet = ECW).

Vektordaten oben
In fast allen GIS wurden in der Vergangenheit überwiegend Vektordaten verarbeitet. Dieser Datentyp wird zur Beschreibung folgender geometrischer Formen herangezogen:

- Punkte
- Linien
- Flächen (Polygone)

Punkte repräsentieren einzelne x,y-Koordinaten. Der Punkt an sich besitzt keine Fläche und beschreibt die Lokalität einer besonderen Gegebenheit. Dies können kartographisch-geographische Punkte (z.B. Sendemast, Kirchturm) oder punktuelle Sachdatenverweise (ticks, label points) sein.

Linien sind ein oder mehrere Streckensegmente mit topographischer Bedeutung (z.B. Straßen, Flüsse, Eisenbahn etc.) oder abstrakteren Inhalts (Wahl- oder Regierungsbezirke etc.). Sie werden geometrisch durch verknüpfte Punktfolgen (Knotenpunkte = nodes und/oder Scheitelpunkte = vertices) definiert.

Polygone sind geschlossene Linienzüge mit Flächenbezug. Polygone werden zusätzlich oft mit 'Label-Punkten' versehen, welche die Flächen mit Sachdaten bzw. Attributen verknüpfen (z.B. Seen, Siedlungen, Ackerflächen etc.).

Alle drei Vektordaten-Elemente sind durch topologische Verknüpfungen miteinander in mathematische Beziehung gesetzt, wobei die Topologie nicht automatisch erzeugt wird, sondern vom Benutzer interaktiv bestimmt wird (Abb. 4.1.4).

Abb. 4.1.4: Beziehungen und Struktur von Vektordaten (ERDAS, 1997)

 

Vektordaten können auf dem Digitalsiertablett von Karten, Photos oder anderen Hardkopien erzeugt werden. Einige Programme bieten auch die Digitalisierung direkt auf dem Bildschirm oder durch Importmöglichkeiten aus anderen Quellen an.

Gängige Formate sind in Anlehnung an z.B. ArcGIS *.shp bzw. *.lyr, oder aus CAD-Anwendungen das *.dxf Format. Programme wie z.B. ERDAS IMAGINE, bieten auch direkte Raster/Vektor-Konvertierungen an (Abb. 4.1.5). Gerade thematische Rasterdatensätze (z.B. Klassifizierungen) werden z.T. vektorisiert und mit Sachdaten der GIS- Datenbank verknüft (z.B. Oracle oder Access).

Abb. 4.1.4: Prinzip der Raster/Vektor-Konvertierung unter ERDAS IMAGINE (ERDAS, 1997)

Die Größe von Vektordatensätzen schwankt naturgemäß mit der Anzahl von erfaßten Polygonen, Punkten und Linien. Dennoch fallen die Dateien oft wesentlich kleiner aus, als dies bei entsprechenden Rasterdaten der Fall ist. Sachdaten werden im Normalfall nicht in den Vektordatensatz eingebunden, sondern in einer externen Datenbankdatei mit Label-Punkten des Vektor-Datensatzes innerhalb eines GIS verknüpft. Moderne GIS verarbeiten sowohl Vektor- als auch Rasterdaten problemlos parallel bzw. kontextuell.

oben

nächstes Kapitel