Page Title

Benutzer-Werkzeuge

Webseiten-Werkzeuge


mikeurban:anleitungen:import_datenpruefung-wertebereiche

Dies ist eine alte Version des Dokuments!


Datenprüfung – Wertebereiche

Fehlende Werte oder Ausreißer

Die Suche nach fehlenden Werten oder Ausreißern, das sind auffällige Abweichungen nach oben oder unten, ist ganz einfach. Trotzdem werden Daten oft unkontrolliert an den Modellierer übergeben, und dementsprechend treten bereits bei dieser Prüfung viele Unregelmäßigkeiten zu Tage.

Tabellenkalkulationsprogramm

Markieren Sie den Datenbereich in Ihrer Tabelle und verwenden Sie den Befehl "Daten > Sortieren" um die Tabelle nach einem interessanten Attribut (Spalte) zu sortieren.

ArcMap

(1) Fügen Sie die interessanten Datensätze zu einem neuen ArcMap-Dokument hinzu; das können beispielsweise Shape-Dateien sein, die Sie vor dem Import inspizieren möchten.

(2) Öffnen Sie die Attributtabelle.

(3) Klicken Sie mit der rechten Maustaste auf einen Spaltenkopf und wählen Sie "Sortieren".

Zur Vertiefung kann man nach einem bestimmtes Attribut, beispielsweise nach der Geländehöhe, auch farblich klassifizieren, um Punkte zu finden, die zwar im normalen Wertebereich liegen, aber lokale Fehler darstellen.

MIKE URBAN

FIXME

Prüfungen im Kanalnetz

eventuell auch Haltungslänge prüfen, vor allem wegen sehr kurzer Haltungen. spätestens in MIKE URBAN mit Length_C.

Doppelte Feldeinträge suchen

Vor allem die Felder Knoten ID, Haltung ID, Rohr ID, kurzum alle Felder, die datenbankintern MUID heißen, müssen einen eindeutigen Wert enthalten. Bevor man Datensätze importiert, sollte man daher diese Felder auf Duplikate bzw. mehrfache Feldeinträge hin überprüfen.

Man kann übrigens den Import so konfigurieren, dass MIKE URBAN einen Datensatz überspringt, der eine bereits vorhandene MUID enthält, allerdings könnten auf diese Weise unbemerkt Datensätze verloren gehen. FIXME mehr dazu.

Excel

Excel bietet eine komfortable Möglichkeit, nicht eindeutige Einträge mit einer speziellen bedingten Formatierung hervorzuheben.

Um die entsprechenden Datensätze zu finden, muss man durch die Liste blättern und auf farbige Zellen achten.

Oder Sie wenden die Funktion ZÄHLENWENN(Bereich;Suchkriterien) an. Beachten Sie den absoluten Zellbezug des blau markierten Bereichs, zu erzielen, indem man unmittelbar nach der Auswahl <F4> drückt. Kopieren Sie die Funktion nach unten.

Anschließend filtern Sie nach Zeilen mit Werten größer 1.

Quelle: Find Duplicates - Excel Easy

ArcMap

Liegen die Daten in einem GIS-Format, beispielsweise als Shape-Dateien vor, können Sie entweder die Tabelle nach Excel exportieren und die oben beschriebene Methode anwenden, oder Sie bleiben in ArcMap und gehen wie folgt vor.

  • Feldstatistik durchführen und das Ergebnis wieder reinjoinen; alle > 1 filtern

Nur mit ArcGIS Advanced: Find Identical (Data Management)

mikeurban/anleitungen/import_datenpruefung-wertebereiche.1520192835.txt.gz · Zuletzt geändert: 2018/03/04 20:47 von thomas