banner
Heim / Blog / Eine objektive Methode zur Erfassung von Abwesenheitsdaten zur Kartierung der Erdrutschanfälligkeit
Blog

Eine objektive Methode zur Erfassung von Abwesenheitsdaten zur Kartierung der Erdrutschanfälligkeit

Aug 21, 2023Aug 21, 2023

Scientific Reports Band 13, Artikelnummer: 1740 (2023) Diesen Artikel zitieren

1270 Zugriffe

4 Zitate

Details zu den Metriken

Die Genauigkeit und Qualität der Erdrutschanfälligkeitskarte hängen von den verfügbaren Erdrutschstandorten und der Stichprobenstrategie für Abwesenheitsdaten (Nicht-Erdrutschstandorte) ab. In dieser Studie schlagen wir eine objektive Methode zur Bestimmung des kritischen Werts für die Stichprobe von Abwesenheitsdaten basierend auf Mahalanobis-Distanzen (MD) vor. Wir demonstrieren diese Methode anhand der Erdrutschanfälligkeitskartierung von drei Unterbezirken (Upazilas) des Distrikts Rangamati, Bangladesch, und vergleichen die Ergebnisse mit der Erdrutschanfälligkeitskarte, die auf der Grundlage der neigungsbasierten Abwesenheitsdaten-Stichprobenmethode erstellt wurde. Unter Verwendung der 15 ursächlichen Erdrutschfaktoren, einschließlich Neigung, Ausrichtung und Grundrisskrümmung, bestimmen wir zunächst den kritischen Wert von 23,69 basierend auf der Chi-Quadrat-Verteilung mit 14 Freiheitsgraden. Dieser kritische Wert wurde dann verwendet, um den Stichprobenraum für 261 zufällige Abwesenheitsdaten zu bestimmen. Im Vergleich dazu haben wir einen anderen Satz der Abwesenheitsdaten ausgewählt, der auf einem Steigungsschwellenwert von < 3° basiert. Die Erdrutschanfälligkeitskarten wurden dann mithilfe des Random-Forest-Modells erstellt. Die Receiver Operating Characteristic (ROC)-Kurven und der Kappa-Index wurden zur Genauigkeitsbewertung verwendet, während der Seed Cell Area Index (SCAI) zur Konsistenzbewertung verwendet wurde. Die mit unserer vorgeschlagenen Methode erstellte Erdrutschanfälligkeitskarte weist relativ hohe Modellanpassungs- (0,87), Vorhersage- (0,85) und Kappa-Werte (0,77) auf. Obwohl die durch die geneigte Probenahme erstellte Erdrutschanfälligkeitskarte ebenfalls eine relativ hohe Genauigkeit aufweist, deuten die SCAI-Werte auf eine geringere Konsistenz hin. Darüber hinaus ist die neigungsbasierte Stichprobenziehung höchst subjektiv; Daher empfehlen wir die Verwendung einer MD-basierten Abwesenheitsdatenstichprobe für die Kartierung der Erdrutschanfälligkeit.

Erdrutsche sind die Bewegung von Gestein, Boden und Erde entlang eines Hangs1, wenn die Scherbeanspruchung des Hangmaterials die Scherfestigkeit2 übersteigt. Es verursacht Schäden an der Infrastruktur und den Verlust von Menschenleben weltweit3,4,5. Erdrutschinventur und Anfälligkeitskartierung sind von entscheidender Bedeutung, um die durch Erdrutsche verursachten Verluste zu begrenzen2,6,7,8,9. Das Erdrutschinventar dokumentiert frühere Erdrutsche10, während die Erdrutschanfälligkeit die Wahrscheinlichkeit von Erdrutschen in einem Gebiet beschreibt11. Erdrutsche werden durch verschiedene ursächliche Faktoren beeinflusst, wie z. B. Neigung, Krümmung, Landnutzung/Landbedeckung, Geologie und Höhe7,12,13. Das Erdrutschinventar und seine Beziehung zu verschiedenen Kausalfaktoren können zur Ableitung der Erdrutschanfälligkeitskarte14 herangezogen werden.

Für die Kartierung der Erdrutschanfälligkeit wurden verschiedene statistische Methoden verwendet, darunter logistische Regression, Support-Vektor-Maschinen, Random Forest und Gradient Boosting15,16,17. Diese statistischen Methoden verwenden Erdrutsch-Kausalfaktoren als unabhängige Variablen und Erdrutschstandorte (Anwesenheitsdaten) und Nicht-Erdrutschstandorte (Abwesenheitsdaten) als abhängige Variablen4. Die Präsenzdaten stammen überwiegend aus der Erdrutschinventur. Im Gegensatz dazu sind die fehlenden Daten in der Regel nicht verfügbar und erfordern eine spezielle Strategie zur Beprobung von Standorten, an denen die Wahrscheinlichkeit eines Erdrutschs gering ist7,18. Die Qualität und Genauigkeit der Erdrutsch-Anfälligkeitskarten hängt nicht nur von der Qualität der Kausalfaktoren und Präsenzdaten ab, sondern auch von der Methode zur Erfassung der Abwesenheitsdaten. Manchmal hängt die Genauigkeit auch davon ab, wie diese Erfassung durchgeführt wird18.

Die Zufallsstichprobe ist der gebräuchlichste Ansatz für die Abwesenheitsdaten. Für die Abwesenheitsdaten werden alle Standorte außer den erfassten Erdrutschen berücksichtigt19,20. Diese Methode erfordert eine repräsentative Bestandsaufnahme der Erdrutsche im gesamten Gebiet21. Es eignet sich für die Kartierung der Erdrutschanfälligkeit in einem relativ kleinen Gebiet, ist jedoch auf großer Fläche oder regionaler Ebene mit Herausforderungen konfrontiert12. Die Genauigkeit der auf Zufallsstichproben basierenden Erdrutschanfälligkeitskarte ist im Allgemeinen gering und tendiert eher zu den bekannten Erdrutschstandorten21. Zur Verbesserung der Genauigkeit und Qualität der Erdrutschanfälligkeitskartierung wurden verschiedene Methoden zur Probenahme von Abwesenheitsdaten vorgeschlagen, einschließlich vorheriger Datenerkundungsanalyse, puffergesteuerter Probenahme, abstands- und dichtebasierter Maßnahmen wie Kerndichteschätzung, euklidischer Abstand, eine Klasse oder Anwesenheit. Nur Klassifizierungsmethode und Modellierung der Artendichteverteilung wie Bioclim7,8,12,21.

Eine vorherige Datenexplorationsanalyse bestimmt eine sichere Zone für die Probenahme von Abwesenheitsdaten auf der Grundlage der verfügbaren Erdrutschstandorte7,8,22. Bei dieser Methode wird im Allgemeinen einer der wichtigsten kausalen Faktoren wie Neigung und Geologie ausgewählt, um die sichere Zone für die Probenahme von Abwesenheitsdaten zu bestimmen8,12. Die mit dieser Methode generierten Ergebnisse sind jedoch auf den ausgewählten Faktor ausgerichtet. Wenn die sichere Zone beispielsweise auf der Grundlage der Steigung bestimmt wird, wird das Modell wahrscheinlich in Richtung der Steigung tendieren8. Yao et al.23 verwendeten eine pufferkontrollierte Stichprobenmethode und gingen davon aus, dass nahe beieinander liegende Gebiete ähnlicher sind als weit voneinander entfernte Gebiete. Die Auswahl des Pufferabstands ist subjektiv, da sie vom Expertenwissen abhängt21. Hong et al.24 schlugen eine Ein-Klassen-Klassifizierungs- oder Präsenzmethode vor, die der Ein-Klassen-Support-Vector-Machine-Methode ähnelt. Bei dieser Methode werden Klassifizierungsdaten wie Abwesenheits- und Anwesenheitsdaten nicht in der Trainingsphase des Modells angegeben. Nur die Präsenzdaten werden verwendet, um ein Gebiet in zwei Teile zu klassifizieren: Ein Teil ähnelt den Präsenzdaten oder Erdrutschen, und der andere weist Unterschiede zu den Erdrutschen auf. Der Bereich mit hohen Unähnlichkeiten wird für die Stichprobenentnahme von Abwesenheitsdaten verwendet.

Bei der entfernungsbasierten Probenahme wird davon ausgegangen, dass Gebiete mit ähnlichen Umweltbedingungen (erklärt durch die kausalen Faktoren) ähnliche geomorphologische Prozesse wie Erdrutsche erfahren8,21. Um den Stichprobenraum für Abwesenheitsdaten zu bestimmen, ist ein Abstandsschwellenwert, der sogenannte kritische Wert, erforderlich19. Obwohl mehrere abstandsbasierte Maße verwendet wurden, muss die Bestimmung dieses kritischen Werts noch erklärt werden21. Im Allgemeinen wählen Benutzer den kritischen Wert subjektiv aus, um die Genauigkeit der Erdrutschanfälligkeitskarte8 zu maximieren. Darüber hinaus wird nur eine Methode, wie die Fläche unter der Kurve oder der kontinuierliche Boyce-Index, zur Bewertung der Abbildungsgenauigkeit17,21 ohne Berücksichtigung der Abbildungskonsistenz17,25 verwendet. Ein Erdrutschanfälligkeitsmodell kann eine hohe Genauigkeit erreichen, indem die Fläche unter hohen und sehr hohen erdrutschgefährdeten Zonen vergrößert wird. Es kann jedoch sein, dass die Erdrutschanfälligkeit dadurch überschätzt wird, dass erdrutschfreie Gebiete als gefährdete Zonen ausgewiesen werden26. Eine praktische Umsetzung der überschätzten Karte ist nicht möglich, da sie ihre Konsistenz verliert17. Zhu et al.21 fanden heraus, dass eine Verringerung des Stichprobenraums der Abwesenheitsdaten die Genauigkeit der Erdrutschanfälligkeitskarte erhöht, die Erdrutschanfälligkeit jedoch möglicherweise überschätzt8,21. Die Wahl des kritischen Werts oder Schwellenwerts ist wichtig, um sowohl Genauigkeit als auch Konsistenz zu gewährleisten.

Es wurden verschiedene Probenahmemethoden vorgeschlagen, von denen jede einige Mängel aufweist. Die vorherige Datenexplorationsanalyse kann eine voreingenommene Methode sein. Bei der entfernungsbasierten Methode hat die Auswahl des Entfernungsschwellenwerts einen Einfluss auf die Genauigkeit der Erdrutschanfälligkeitskarte. Darüber hinaus können für neigungs- und streckenbasierte Verfahren verschiedene Schwellenwerte angewendet werden und basierend auf der Genauigkeit wird ein Schwellenwert ausgewählt, der die Objektivität dieser Methoden verringert. In dieser Hinsicht besteht Bedarf an einer objektiven Methode, die für jeden Teil der Welt anwendbar ist und auch nicht von den Variablen oder ursächlichen Faktoren der Anfälligkeitskartierung abhängig ist. Um diese Lücke zu schließen, haben wir in dieser Arbeit eine objektive Methode zur Bestimmung des kritischen Werts der Abwesenheitsdatenstichprobe basierend auf der Chi-Quadrat-Verteilung der Mahalanobis-Distanz und einem vom Benutzer angegebenen Konfidenzniveau vorgeschlagen. Wir haben diese vorgeschlagene Methode auf die Kartierung der Erdrutschanfälligkeit in den drei Upazilas (Unterbezirk) des Bezirks Rangamati, Bangladesch, angewendet und die Modellleistung mit einer traditionell verwendeten neigungsbasierten Methode zur Stichprobenentnahme von Abwesenheitsdaten verglichen.

In dieser Studie wurde das dritte Gesetz der Geographie21 verwendet, um den Stichprobenraum für die Stichprobenentnahme von Abwesenheitsdaten zu bestimmen. Gemäß dem dritten Hauptsatz der Geographie kommt es in zwei Gebieten mit derselben geografischen Umgebung zu denselben geografischen Prozessen wie Erdrutschen21. Die in dieser Studie verwendeten Merkmale der geografischen Umgebung sind die ursächlichen Faktoren für den Erdrutsch. Da wir nach Probenahmeräumen für die Probenahme von (Erdrutsch-)Abwesenheitsdaten suchen, müssen wir Gebiete mit den geringsten Ähnlichkeiten zu den Orten der Erdrutsche finden. Wir gehen davon aus, dass Erdrutschstandorte eine geomorphische Umgebung aufweisen, die durch erdrutschkausale Faktoren definiert wird. Beispielsweise ist die Neigung ein ursächlicher Faktor für Erdrutsche, und für alle Erdrutschstellen gibt es einen typischen Neigungswert (z. B. die durchschnittliche Neigung für die beobachteten Erdrutschstellen). Wir suchen Standorte, deren Neigung die größten Unterschiede zum typischen Gefälle der Rutschungsstandorte aufweist. Wenn wir n Erdrutschstandorte und p kausale Faktoren haben, dann weisen diese Orte einen mittleren Umweltzustand auf, der auf den p kausalen Faktoren basiert. Standorte ohne Erdrutsch werden weiter von diesem Durchschnittszustand entfernt sein. Diese Studie verwendet die Mahalanobis-Distanz, um den Abstand zwischen dem mittleren Erdrutschzustand und dem Zustand eines potenziellen Standorts zu messen und das Ausmaß seiner Unähnlichkeit mit den Erdrutschstandorten zu bestimmen.

Die Mahalanobis-Distanz (MD) ist eine Distanzmetrik, die die Distanz zwischen einem Datenpunktstandort und der Verteilung von Datensätzen misst27,28. MD ist eine Erweiterung der Euklidischen Distanzmetrik und kann Clustering- und Klassifizierungsalgorithmen verbessern19. Der euklidische Abstand misst den Abstand zwischen zwei Punkten im p-dimensionalen Raum. Es funktioniert gut, wenn die Dimensionsräume unabhängig voneinander sind28. MD ist eine Verallgemeinerung des euklidischen Abstands, die eine mögliche gegenseitige Abhängigkeit zwischen den Dimensionsräumen ermöglicht, indem der euklidische Abstand durch die Kovarianzmatrix dividiert wird19. Genauer gesagt ist die MD eines potenziellen Punktes, der durch einen Vektor von Kausalfaktoren X aus der Schwerpunktdarstellung einer Erdrutschpunktwolke mit mittlerem Vektor m und einer Kovarianzmatrix C dargestellt wird:

Wie in Gl. dargestellt. (1) MD reduziert die Korrelation von Variablen, indem es die Distanzmatrix durch die Kovarianzmatrix dividiert27. MD wurde im Allgemeinen zur Erkennung von Ausreißern und zur Klassifizierung mehrerer Klassen verwendet28. Bei der Kartierung der Anfälligkeit für Erdrutsche kann MD verwendet werden, um den Stichprobenraum für Abwesenheitsdaten zu definieren. Die erfassten Erdrutschstandorte decken nur einen sehr kleinen Teil des Untersuchungsgebietes ab. Daher wird ein großer Teil des Gebiets nicht als Erdrutsch oder Nicht-Erdrutsch eingestuft28. Basierend auf der Lage von Erdrutschen und der Verteilung der ursächlichen Faktoren definiert MD die Ähnlichkeit eines Gebiets mit den Bedingungen von Erdrutschen. Wenn die Ähnlichkeit hoch ist, besteht in dem Gebiet ein hohes Risiko für Erdrutsche und es ist nicht für die Stichprobenentnahme mit Abwesenheitsdaten geeignet.

Es ist jedoch schwer zu bestimmen, ob die Ähnlichkeit eines Gebiets für die Stichprobenerhebung mit Abwesenheitsdaten unterschiedlich genug ist. Einige Studien verwendeten den Wert des 5. Quantils, um den Abwesenheitsstichprobenraum zu definieren19. Zhu et al.21 testeten eine Reihe benutzerdefinierter Schwellenwerte, um den geeigneten Wert für die Kartierung der Erdrutschanfälligkeit zu ermitteln. Ihre Arbeit zeigte, dass die Reduzierung des Probenahmeraums bei Abwesenheit die Genauigkeit zwar kontinuierlich erhöht, aber die Anfälligkeit für Erdrutsche überschätzt. Diese einfache Ausprobierungsstrategie bietet jedoch keine statistische Möglichkeit, den optimalen Schwellenwert für die Stichprobenentnahme von Abwesenheitsdaten zu bestimmen.

Wir haben einen Ansatz vorgeschlagen, um ein statistisches Mittel zur Bestimmung des MD-Schwellenwerts für die Stichprobenentnahme von Abwesenheitsdaten bereitzustellen. Der MD ist eine normalisierte Größe. Wenn die kausalen Faktoren eine Verteilung aufweisen, die durch die p-variate Gaußsche Verteilung angenähert werden kann, folgt die MD einer Chi-Quadrat-Verteilung mit p-1 Freiheitsgraden. Selbst wenn die Kausalfaktoren keine ungefähre p-variate Gaußsche Verteilung haben, weist die MD darüber hinaus eine ungefähre Chi-Quadrat-Verteilung mit p−1 Freiheitsgraden auf, solange die Anzahl der Kausalfaktoren groß genug ist (Nader et al .). Basierend auf dieser Annahme kann ein kritischer Wert für ein bestimmtes Signifikanzniveau bestimmt werden, beispielsweise das allgemein angenommene Signifikanzniveau von 0,05. Wenn wir beispielsweise in unserer Studie 15 kausale Faktoren verwenden, beträgt der kritische Wert des MD, d. Das heißt, wenn der MD größer als dieser kritische Wert ist, gilt er als Ausreißer oder als ausreichend unterschiedlich vom Rest der Daten27. Daher verwenden wir einen solchen kritischen Wert, um die Orte für die Stichprobenentnahme von Abwesenheitsdaten zu bestimmen.

Abbildung 1 zeigt das Flussdiagramm unserer vorgeschlagenen Methode. Wie oben angegeben, stellt n die Anzahl der verfügbaren Erdrutschstandorte und p die Anzahl der ursächlichen Faktoren dar. Ein kritischer Wert wird anhand der p−1 Freiheitsgrade ermittelt. Dieser kritische Wert bestimmt, ob ein neuer Punkt oder Ort ein potenzieller Kandidat für die Stichprobenentnahme von Abwesenheitsdaten ist. Für jeden neuen Kandidatenstandort wurde MD basierend auf dem Mittelwert und der Kovarianzmatrix der Verteilung der Kausalfaktoren der n Erdrutschstandorte berechnet. Ein Ort oder Punkt mit einem MD-Wert, der über dem kritischen Wert liegt, wird als sichere Zone für die Probenahme von Abwesenheitsdaten ausgewiesen.

Flussdiagramm der MD-basierten Abwesenheitsdatenstichprobe.

Um die Effizienz dieser vorgeschlagenen Methode zu demonstrieren, haben wir sie auf die Kartierung der Erdrutschanfälligkeit in drei Upazilas im Distrikt Rangamati, Bangladesch, angewendet und die daraus abgeleitete Karte der Erdrutschanfälligkeit mit der Karte verglichen, die auf der Grundlage einer traditionellen geneigten Methode für Abwesenheitsdaten erstellt wurde Probenahme.

Diese Studie konzentrierte sich auf drei Upazilas des Distrikts Rangamati in Bangladesch: Rangamati Sadar, Kaptai und Kawkhali (Abb. 2). Rangamati Sadar ist die größte Stadt in dieser Gegend. Im Juni 2017 kamen in diesem Bezirk mehr als 100 Menschen durch Erdrutsche ums Leben (Abb. 3), und diese drei Upazilas waren die am stärksten betroffenen Gebiete29. Dieser Bezirk umfasst 1145 km230 mit einem Höhenbereich von 7 bis 576 m über dem mittleren Meeresspiegel und einem Neigungsbereich von 0° bis 52°. Der westliche Teil des Gebietes weist ein vergleichsweise sanftes Gefälle auf, während der westliche und zentrale Bereich relativ steil ist. Das Grundgestein dieses Gebiets besteht aus mehreren geologischen Formationen, darunter Dihing-, Dupitila-, Girujan-Ton-, Bhuban-, Bokabil- und Tipam-Sandstein31. Der größte Teil der Fläche ist von natürlicher Vegetation oder Plantagenfeldern bedeckt. Plantagenlandwirtschaft und ungeplante Landnutzungs-/Landbedeckungsänderungen schaffen günstige Bedingungen, und intensive Regenfälle lösen in diesem Gebiet Erdrutsche aus6,25.

Untersuchungsgebiet: Standorte von drei Upazilas (Rangamati Sadar Kaptai und Kawkhali).

Bilder einiger Erdrutsche im Untersuchungsgebiet (Bilder wurden von den Forschern im Juli 2017 aufgenommen).

Von Januar 2001 bis Januar 2019 wurden insgesamt 261 Erdrutschorte (Abb. 2) erfasst. Diese Erdrutsche wurden von32 auf der Grundlage des integrierten Feldes und der Google Earth-Kartierung sowie von Rabby et al.31 auf der Grundlage der Google Earth-Kartierung erfasst.

Wir verwendeten 15 kausale Erdrutschfaktoren für die Kartierung der Erdrutschanfälligkeit (Abb. 4 und 5), basierend auf der Verfügbarkeit von Daten und früherer Literatur29,33. Die Rasterkarten dieser Faktoren wurden von Abedin et al.29 erstellt und wir haben die Karten mit Arcmap 10.8 modifiziert. Tabelle 1 listet die Faktoren, Auflösungen, Typen und Datenquellen dieser Rasterkarten auf. Da die Auflösung der meisten Faktoren 30 m beträgt, haben wir 30 m als Auflösung für die Erdrutschanfälligkeitskartierung gewählt.

Kausalfaktoren für Erdrutsche: (a) Höhe; (b) Steigung; (c) Plankrümmung; (d) Profilkrümmung; (e) Aspekt; (f) TWI; (g) SPI; (h) Entfernung vom Straßennetz; (i) Entfernung vom Entwässerungsnetz; (j) Abstand von Verwerfungslinien (geändert nach 25).

Kausalfaktoren für Erdrutsche: (a) Geologie; (b) Niederschlag; (c) NDVI; (d) Landnutzung/Landbedeckung; (e) Landnutzungs-/Landbedeckungsänderung (geändert von 25).

Wir haben die MD-Werte für alle Erdrutschstandorte basierend auf den 15 kausalen Faktoren berechnet. Die MD-Werte lagen zwischen 1,2 und 200,8 (Abb. 6). Der Freiheitsgrad für die ungefähre Chi-Quadrat-Verteilung der MD-Werte basierend auf diesen 15 Faktoren beträgt 14, was zu einem kritischen Wert von 23,69 für das Signifikanzniveau von 0,05 führt. Wir haben den MD-Wert für jeden Standort basierend auf dem Mittelwert und der Kovarianzmatrix berechnet, die aus den Erdrutschstandorten abgeleitet wurden. Anschließend haben wir diesen kritischen Wert angewendet, um den Stichprobenraum für die Abwesenheitsdaten von (Abb. 6) zu bestimmen. Insbesondere werden die Standorte, deren MD-Werte über dem Schwellenwert liegen, für die Stichprobenentnahme von Abwesenheitsdaten verwendet, um 261 Abwesenheitsdaten zufällig zu generieren.

Räumliche Verteilung der Mahalanobis-Distanz (MD) und des Probenahmeraums (Karten wurden mit ArcMap 10.8 erstellt).

Zum Vergleich verwendeten wir auch eine neigungsbasierte Stichprobe, um den Bereich mit geringer Erdrutschwahrscheinlichkeit für Abwesenheitsdaten zu bestimmen34. Die Neigungsschwelle wird auf der Grundlage von Expertenwissen und Urteilsvermögen bestimmt. Adnan et al.29 verwendeten den Steigungsschwellenwert von < 2° für die Probenahme von Abwesenheitsdaten im Distrikt Cox's Bazar in Bangladesch. Ali et al.37 ermittelten in ihrer Studie im Einzugsgebiet des Flusses Kysuca in der Slowakei Gebiete mit einer Neigung von < 3° für die Probenahme ohne Daten. Wir haben einen Steigungsschwellenwert < 3° verwendet, um die 261-Abwesenheitsdaten zufällig zu erfassen (Abb. 7).

Probenahmebereich für Abwesenheitsdaten basierend auf unterschiedlichen Neigungsschwellenwerten (Karten wurden mit ArcMap 10.8 erstellt).

Wir haben das Zufallswaldmodell verwendet, um die Erdrutschanfälligkeitskarten zu erstellen. Das von Breiman38 vorgeschlagene Random-Forest-Modell ist eine Ensemble-Lernmethode39. Bootstrap-Aggregation wird in RF verwendet, um Teilmengen von Beobachtungen auszuwählen. Es generiert eine Reihe von Entscheidungsbäumen21 und dekorreliert die Bäume39. Die Ensembles von Entscheidungsbäumen entschieden über die Klassenzugehörigkeit der abhängigen Variablen basierend auf der höchsten Stimmenzahl40. Beim Training des Modells verwendet RF nicht alle Prädiktoren, sondern eine Zufallsstichprobe von Prädiktoren39. In einer Studie kann es mehrere starke Prädiktoren geben, und bei der Aufteilung der Bäume werden diese Prädiktoren einen Einfluss haben. RF nutzt eine Teilmenge von Prädiktoren, um dieses Problem zu lösen21. Da nicht alle Datensätze bei der Modellierung verwendet werden, werden die ungenutzten Daten als Out-of-Bag (OOB)40,41 bezeichnet. Diese nicht ausgewählten Datensätze werden zur Bestimmung des Fehlers und der Bedeutung der Prädiktoren im Modell39 verwendet. Wir haben das Paket „randomForest“ in R verwendet, um das RF-Modell für die Erdrutschanfälligkeitskartierung zu entwickeln42.

Wie bereits beschrieben, haben wir die gleiche Anzahl an Nicht-Erdrutsch-Standorten generiert (261). Dabei entstand ein Datensatz von 522 (261: Anwesenheitsdaten; 261 Abwesenheitsdaten). Für die Kartierung der Erdrutschanfälligkeit haben wir den Datensatz in Trainings- (391: 75 %) und Validierungsdatensätze (130: 25 %) unterteilt. Bei der MD-basierten Probenahmemethode verwendeten wir alle 15 Faktoren für die Kartierung der Erdrutschanfälligkeit. Wir haben das Gefälle nicht in die Kartierung der Erdrutschanfälligkeit für die gefällebasierte Methode einbezogen, da die Abwesenheitsdaten auf der Grundlage des Gefälleschwellenwerts erfasst wurden.

Wir verwenden statistische indexbasierte Maße: True-Positive-Rate (TPR) (Sensitivität), True-Negative-Rate (TNR) (Spezifität) und Kappa-Index. TPR ist der Anteil der Erdrutschstandorte, die vom Modell korrekt als Erdrutschstandorte klassifiziert wurden. TNR ist der Anteil der Abwesenheitsdaten, die vom Modell korrekt als Abwesenheitsdaten klassifiziert werden7. Der Kappa-Index (Gleichung 2) ist das Verhältnis der beobachteten und erwarteten Übereinstimmung und repräsentiert die Zuverlässigkeit des Modells7,40.

wobei Pobs = beobachtete korrekte Klassifizierungsrate, Pexp = erwartete korrekte Klassifizierungsrate

wobei TP = echte Positive (Erdrutschstandorte, die vom Modell als Erdrutschstandorte klassifiziert werden); TN = echte Negative (Standorte ohne Erdrutsch, die vom Modell als Standorte ohne Erdrutsch klassifiziert werden); FN = falsch-negative Ergebnisse (Erdrutschstandorte, die vom Modell als Nicht-Erdrutschstandorte klassifiziert wurden); FP = falsch positive Ergebnisse (Standorte ohne Erdrutsch, die vom Modell als Standorte mit Erdrutsch klassifiziert werden); n = Anteil der korrekt klassifizierten Pixel; N = die Anzahl der gesamten Ausbildungsstandorte; Der Kappa-Index reicht von 0 bis 1, wobei 0 angibt, dass die Übereinstimmung aufgrund einer zufälligen Schätzung erfolgte, während 1 eine perfekte Übereinstimmung anzeigt.

Die oben genannten statistischen indexbasierten Maße werden unter Verwendung eines hinteren Schwellenwerts von 0,5 berechnet. Das heißt, wenn die geschätzte A-Posteriori-Wahrscheinlichkeit, dass es sich bei einem Standort um einen Erdrutschstandort handelt, angesichts der beobachteten Werte der Kausalfaktoren 0,5 übersteigt, klassifiziert das Modell ihn als Erdrutschstandort. Andernfalls wird es als nicht erdrutschgefährdeter Standort eingestuft. Allerdings könnte ein Schwellenwert von 0,5 zu hoch sein und diese Kennzahlen sind nicht besonders ideal für die Risikoprofilierung von Erdrutschstandorten. Aus diesem Grund verwenden wir auch die ROC-Kurve (Receiver Operating Characteristics) zur Beurteilung der Modellleistung. Die ROC-Kurve ist eine grafische Darstellung der Klassifizierungsleistung eines Modells bei verschiedenen hinteren Wahrscheinlichkeitsschwellenwerten35. Es wird durch Auftragen der Falsch-Positiv-Raten (FPR) auf der X-Achse und der Echt-Positiv-Raten (TPR) auf der Y-Achse erstellt, die aus einem Raster von hinteren Wahrscheinlichkeitsschwellenwerten ermittelt werden. Um die Modelle zu vergleichen, haben wir die Fläche unter den ROC-Kurven (AUC) verwendet, die die Fläche als Prozentsatz der Fläche unter der Grafik zeigt43. Der Trainingsdatensatz wurde zur Bewertung der Modellanpassungsleistung verwendet, während der Validierungsdatensatz zur Bewertung der Modellvorhersageleistung17 verwendet wurde. Die AUC-Werte für die ROC-Kurve liegen zwischen 0 und 1. Je größer der Wert, desto besser eignet sich das Modell für die Risikoprofilierung von Erdrutschstandorten. Im Allgemeinen gilt eine AUC > 0,7 als faires Modell, und eine AUC < 0,5 weist darauf hin, dass das Modell die Daten zufällig klassifiziert13,44.

Für die Konsistenzbewertung der Modelle wurde der von Suzen und Doyuran45 vorgeschlagene Seed Cell Area Index (SCAI) verwendet. SCAI ist das Verhältnis zwischen der Flächenausdehnung der Anfälligkeitsklassen und dem Prozentsatz der Erdrutsche, die in den Anfälligkeitsklassen aufgetreten sind, und kann als Gleichung beschrieben werden. (5).

wobei Ni = Prozentsatz der Fläche unter der Anfälligkeitsklasse i; ni = Prozentsatz der Erdrutsche der Anfälligkeitsklasse i.

Der SCAI-Wert reicht von 0 bis ∞. Je kleiner der SCAI-Wert ist, desto konsistenter ist das Modell. Der SCAI-Wert nahm von Zonen mit geringer Anfälligkeit zu Zonen mit hoher Anfälligkeit ab46. Dieser Index bestimmt, ob Erdrutschstandorte oder Pixel über eine konservative Flächenausdehnung verteilt sind47. Es kann erkennen, ob ein Modell die Anfälligkeit für Erdrutsche überschätzt. Eine überschätzte Karte der Anfälligkeit für Erdrutsche tendiert dazu, die meisten Gebiete als Zonen mit hoher Anfälligkeit einzustufen (der Prozentsatz der Zonen mit hoher Anfälligkeit ist vergleichsweise höher als in anderen Zonen).

Die Variablenbedeutung zeigt, welche Kausalfaktoren in einem Random-Forest-Modell die größte Vorhersagekraft haben8. In unserer vorgeschlagenen MD-basierten Probenahmemethode (Abb. 8) ist die Höhe (100,0) der wichtigste kausale Faktor, gefolgt von der Entfernung vom Entwässerungsnetz (75,7), der Entfernung von den Verwerfungslinien (66,1), der Neigung (61,6) und Geologie (50.1). Faktoren wie Profilkrümmung (0,0) und NDVI (11,0) haben im Modell die geringste Bedeutung.

Diagramm mit variabler Wichtigkeit des Zufallswaldmodells. CF-Kausalfaktoren, VI-Variablenbedeutung, PR-Profilkrümmung, PL-Plankrümmung, LULCC-Landnutzung/Landbedeckungsänderung, LULC-Landnutzung/Landbedeckung, DRN-Abstand vom Straßennetz, DFF-Abstand von Verwerfungslinien, DDN-Abstand vom Entwässerungsnetz.

Bei der neigungsbasierten Stichprobe (Abb. 8) ist der TWI (100,0) der wichtigste ursächliche Faktor, gefolgt von der Entfernung vom Straßennetz (86,8) und der Höhe (49,7). Der TWI ist ein neigungsbezogener Index. Es wird zum wichtigsten Kausalfaktor, da die Abwesenheitsdaten durch den Steigungsschwellenwert bestimmt wurden und der Steigungsfaktor aus dem Erdrutschanfälligkeitsmodell entfernt wurde. Faktoren wie Aspekt (0,0), SPI (9,3) und PR (17,4) waren die am wenigsten kritischen kausalen Faktoren. SPI ist ein weiterer neigungsbezogener Index; Da der TWI bereits zu einem wesentlichen kausalen Faktor geworden ist, ist ein anderer steigungsbezogener Index im Modell wahrscheinlich weniger wichtig. Der Vergleich der beiden Methoden zeigt, dass unterschiedliche Stichprobenmethoden zu unterschiedlicher Variablensignifikanz führen. Bei der MD-basierten Probenahme ist die Höhe der wichtigste kausale Faktor, während sie bei der neigungsbasierten Probenahmemethode der drittwichtigste kausale Faktor ist. Bei der MD-basierten Stichprobe wurden vergleichsweise kleinere Flächen für die Stichprobenentnahme ohne Daten verwendet, der Stichprobenraum erstreckte sich jedoch über die gesamte Fläche. Andererseits wurden bei der neigungsbasierten Probenahme nur der Kaptai-See, seine nahegelegenen Gebiete und die Gebiete mit sanften Hängen im Südwesten für die Probenahme ohne Daten vorgesehen. Selbst bei denselben Erdrutschstandorten führt die Verwendung verschiedener Methoden zur Erfassung von Abwesenheitsdaten zu unterschiedlichen Erdrutschanfälligkeitskarten.

Jede Erdrutschanfälligkeitskarte bietet Erdrutschwahrscheinlichkeiten von 0,0 bis 1,0. Wir verwendeten eine natürliche Bruchmethode, um die Erdrutschwahrscheinlichkeiten in fünf Anfälligkeitszonen zu klassifizieren (Abb. 9): sehr niedrig, niedrig, mäßig, hoch und sehr hoch.

Erdrutsch-Anfälligkeitskarten basierend auf dem Zufallswaldmodell unter Verwendung von: (a) auf der Mahalanobis-Distanz basierender Abwesenheitsdatenstichprobe; (b) Neigungsbasierte Abwesenheitsdaten-Stichprobe (Karten wurden mit Arcmap 10.8 erstellt).

In der Erdrutschanfälligkeitskarte, die mithilfe unserer vorgeschlagenen MD-basierten Probenahme erstellt wurde, wurden Täler in den südöstlichen Gebieten (Abb. 9) in der Nähe des Rangamati-Sees als Zonen mit geringer oder sehr geringer Anfälligkeit klassifiziert. Im Umfeld der Rutschungsstandorte breiten sich Hoch- und Höchstanfälligkeitszonen aus. Die Zonen mit hoher Anfälligkeit im Nordwesten des Untersuchungsgebiets umfassen die Autobahn Chittagong-Rangamati, da die Entfernung vom Straßennetz im Modell eine größere variable Bedeutung hat. Höhe und Neigung sind die beiden anderen wichtigen ursächlichen Faktoren. Infolgedessen wurden die Gebiete in höheren Lagen und steileren Hängen als Gebiete mit hoher oder sehr hoher Anfälligkeit eingestuft. Der Abstand zu Verwerfungslinien ist ein weiterer kausaler Faktor mit hoher variabler Bedeutung im Modell. Die Bruchlinien in diesem Gebiet erstrecken sich von Nordwesten nach Südwesten; Daher wurden die Gebiete in der Nähe dieser Verwerfungslinien als Zonen mit hoher oder sehr hoher Anfälligkeit eingestuft.

Andererseits wurden für die hangbasierte Abwesenheitsdatenerfassung der Kaptai-See, seine umliegenden Gebiete und einige kleine Gebiete im Südosten als Zonen mit sehr geringer oder geringer Anfälligkeit klassifiziert. Der visuelle Vergleich der Erdrutschanfälligkeitskarten, die mit der geneigten und der MD-basierten Methode erstellt wurden, zeigt, dass vergleichsweise mehr Gebiete als Zonen mit hoher oder sehr hoher Anfälligkeit für die geneigte Probenahmemethode klassifiziert wurden als für die MD-basierte Probenahmemethode. Einige Gebiete im Südosten des Gebiets wurden als Zonen mit geringer oder mittlerer Anfälligkeit für die MD-basierte Probenahmemethode eingestuft. Dennoch wurden dieselben Gebiete bei der geneigten Probenahmemethode als Zonen mit hoher oder sehr hoher Anfälligkeit eingestuft. Die Gebiete in der Nähe der Verwerfungslinien wurden bei der neigungsbasierten Probenahmemethode als Zonen mit hoher oder sehr hoher Anfälligkeit klassifiziert, bei der MD-basierten Probenahmemethode wurden jedoch nur einige Flecken in diesen Gebieten als Zonen mit sehr hoher und hoher Anfälligkeit klassifiziert.

Die Leistung MD-basierter und neigungsbasierter Erdrutschanfälligkeitskarten unter Verwendung der ROC-Kurve ist in Abb. 10 dargestellt. Die AUCs für den Trainingsdatensatz (Abb. 10a) für MD- und neigungsbasierte Probenahme betrugen 0,87 bzw. 0,89. Die AUCs für Validierungsdatensätze (Abb. 10b) für MD- und steigungsbasierte Probenahme betrugen 0,85 bzw. 0,86. Es scheint, dass die steigungsbasierte Stichprobenmethode die MD-basierte Stichprobenmethode leicht übertrifft. Dennoch sind die AUCs für beide Probenahmemethoden ähnlich und liegen in der guten Kategorie von 0,8–0,944. Der visuelle Vergleich zeigt, dass die Karte der geneigten Probenahmemethode etwas mehr Gebiete als Zonen mit hoher oder sehr hoher Anfälligkeit klassifizierte. Es gelang jedoch nicht, zwischen Zonen mit geringer Anfälligkeit und Zonen mit hoher Anfälligkeit zu unterscheiden, und die meisten Gebiete wurden als Zonen mit hoher Anfälligkeit eingestuft, wodurch die Anfälligkeit für Erdrutsche überschätzt wurde.

ROC-Kurven für MD- und steigungsbasierte Suszeptibilitätskarten: (a) Trainingsdatensatz (Steigungsbasiert, AUC = 0,89; MD-basierte AUC = 0,87); (b) Validierungsdatensatz (Steigungsbasierte AUC = 0,86; MD-basierte AUC = 0,85).

Die TPR- und TNR-Werte der durch die MD-basierte Probenahme erstellten Karte (Tabelle 2) betragen für die Trainingsdaten 0,93 bzw. 0,90, was darauf hindeutet, dass diese Karte eine ähnliche Genauigkeit bei der Unterscheidung der Abwesenheits- und Anwesenheitsdaten von Erdrutschen aufweist. Diese beiden Werte reduzieren sich für den Validierungsdatensatz auf 0,88 bzw. 0,89, was auf eine ähnliche Leistung bei der Unterscheidung von Abwesenheits- und Anwesenheits-Erdrutschen für den unbekannten Datensatz hinweist. Die Kappa-Werte sind für den Trainingsdatensatz > 0,8, was eine starke Übereinstimmung darstellt, während sie für den Validierungsdatensatz auf 0,77 sinken, was eine mäßige Übereinstimmung darstellt.

Bei der steigungsbasierten Stichprobe für den Trainingsdatensatz betrugen TPR und TNR (Tabelle 2) 0,97 bzw. 0,82. Im Gegensatz zur MD-basierten Probenahmemethode zeigte die geneigte Probenahmemethode eine bessere Leistung bei der Erkennung von Erdrutschen als die Orte, an denen es keine Erdrutsche gab. Dieses Modell klassifizierte einige Orte, an denen es keine Erdrutsche gab, als Erdrutsche oder löste Fehlalarme aus. Die Kappa-Indizes für den Trainingsvalidierungsdatensatz betrugen 0,79 bzw. 0,78. Die AUC-Werte für das neigungsbasierte Modell waren besser als für das MD-basierte Modell. Der Kappa-Wert war jedoch für das MD-basierte Modell besser. Dies geschah, weil die neigungsbasierte Probenahme einen vergleichsweise niedrigeren TNR aufwies als die MD-basierte Probenahme. Das MD-basierte Modell war bei der Erkennung von Anwesenheits- und Abwesenheitsdaten effizient, wohingegen die steigungsbasierte Stichprobe eine geringe Leistung bei der Erkennung von Abwesenheitsdaten zeigte. Der TPR war beim neigungsbasierten Modell vergleichsweise höher als beim MD-basierten Modell.

SCAI bewertet die Konsistenz des Erdrutschanfälligkeitsmodells. Ein hochkonsistentes Modell hätte niedrige SCAI-Werte mit dem geringsten Prozentsatz der Fläche, die als Zonen mit hoher Anfälligkeit eingestuft wäre, aber die meisten bestehenden Erdrutsche fallen in diese Zonen.

Für die mithilfe der MD-basierten Probenahme erstellte Karte wurden etwa 58,0 % des Untersuchungsgebiets als Zonen mit sehr geringer und geringer Anfälligkeit und etwa 35,0 % des Untersuchungsgebiets als Zonen mit hoher und sehr hoher Anfälligkeit klassifiziert, die etwa 78,0 % davon enthalten die bestehenden Erdrutsche. Die SCAI-Werte sanken von 28,21 auf 0,13 von sehr niedrigen zu sehr hohen Anfälligkeitszonen. Diese Ergebnisse deuten darauf hin, dass die Anfälligkeitskarte konsistent ist und einen erheblichen Teil des Gebiets als Zonen mit sehr geringer und geringer Anfälligkeit klassifiziert. Die SCAI-Werte betragen 0,13 für Zonen mit hoher Anfälligkeit, was darauf hindeutet, dass das Modell nur sehr wenige Prozente der Fläche als Zonen mit sehr hoher Anfälligkeit klassifiziert hat.

Etwa 42,0 % (Tabelle 3) des Untersuchungsgebiets wurden aufgrund der Neigung als Zone mit geringer oder sehr geringer Anfälligkeit eingestuft. Im Gegensatz dazu wurden etwa 46,0 % des Untersuchungsgebiets entweder als Gebiete mit hoher oder sehr hoher Anfälligkeit eingestuft. Im Vergleich zur MD-basierten Probenahme wurden bei der geneigten Probenahme fast doppelt so viele Gebiete als Zonen mit hoher und sehr hoher Anfälligkeit klassifiziert. Sowohl die Steigungs- als auch die MD-basierte Probenahme ergaben eine ähnliche Genauigkeit. Dennoch klassifizierte die Erdrutschanfälligkeit auf der Grundlage einer geneigten Probenahme fast die Hälfte des Gebiets als Zone mit hoher und sehr hoher Anfälligkeit. Dies deutet auf eine Überschätzung der Erdrutschanfälligkeit durch das Modell hin. Mit der Änderung der Anfälligkeit verringerte sich der SCAI-Wert. In der Zone mit sehr hoher Anfälligkeit betrug der SCAI-Wert 0,43, was dem Dreifachen des SCAI-Werts in dieser Anfälligkeitszone bei der MD-basierten Probenahme entspricht. Daher ist die Karte der Anfälligkeit für Erdrutsche, die mithilfe von neigungsbasierten Schösslingen erstellt wurde, nicht so konsistent und wünschenswert wie die MD-basierte Stichprobe von Abwesenheitsdaten.

Wir haben eine objektive MD-basierte Methode zur Erfassung von Abwesenheitsdaten vorgeschlagen und diese mit der geneigten Methode zur Kartierung der Erdrutschanfälligkeit verglichen. Es wurde angenommen, dass die MD-Werte der Chi-Quadrat-Verteilung folgten. Der Schwellenwert für die Stichprobenentnahme von Abwesenheitsdaten wurde dann durch den Freiheitsgrad der Chi-Quadrat-Verteilung und ein bestimmtes Konfidenzniveau bestimmt. Unsere Ergebnisse deuten darauf hin, dass sich der fehlende Probenahmeraum für unsere vorgeschlagene Methode über das gesamte Untersuchungsgebiet erstreckt, wodurch eine Stichprobenverzerrung hin zu bestimmten Erdrutschstandorten vermieden wird. Obwohl auch andere abstandsbasierte Matrizen wie der Ähnlichkeitsindex verwendet wurden21, wurde der kritische Wert für die Abwesenheitsdatenstichprobe subjektiv bestimmt. Unsere vorgeschlagene Methode bietet ein objektives und statistisch belastbares Mittel zur Bestimmung des kritischen Werts auf der Grundlage der Chi-Quadrat-Verteilung der MD-Werte der Erdrutschstandorte und eines vom Benutzer angegebenen Konfidenzniveaus.

Bei der Kartierung der Anfälligkeit für Erdrutsche wird häufig eine neigungsbasierte Probenahme verwendet12,19,48. Obwohl die Steigung zur Bestimmung der sicheren Zone für die Erfassung von Abwesenheitsdaten verwendet wird, wird sie als Faktor im Modell verwendet. Die Neigung spielt die entscheidende Rolle bei der Bestimmung der Erdrutschanfälligkeit eines Gebiets. Im Gegensatz zur MD-basierten Stichprobe ist es jedoch unmöglich, den kritischen Wert für die steigungsbasierte Stichprobe auf der Grundlage unserer vorgeschlagenen Methode zu bestimmen, da der Freiheitsgrad Null ist. In unserer Vergleichsstudie war die Größe des Probenahmeraums basierend auf der Neigungsschwelle < 3° vergleichsweise größer als die MD-basierte Probenahme, der Probenahmeraum war jedoch stärker im Kaptia-See und in der Umgebung angesiedelt. Daher wurden die Abwesenheitsdaten nur aus diesen Clustergebieten erhoben. Die neigungsbasierte Probenahme klassifizierte die meisten Gebiete als Zonen mit sehr hoher oder sehr geringer Anfälligkeit. Außerdem wurden einige erdrutschfreie Zonen als gefährdete Zonen eingestuft, wodurch die Anfälligkeit für Erdrutsche überschätzt wurde8. Darüber hinaus stellen wir fest, dass in einigen Studien auch die Steigung in das Modell einbezogen wurde, obwohl diese bereits für die Stichprobenentnahme von Abwesenheitsdaten verwendet wurde.12,13 Die Verwendung der Steigung sowohl bei der Stichprobenentnahme von Abwesenheitsdaten als auch bei der Modellierung der Anfälligkeit für Erdrutsche führt wahrscheinlich zu einem verzerrten Modell hinsichtlich der Steigung . Wir empfehlen, die Steigung im Erdrutschanfälligkeitsmodell auszuschließen, wenn es für die Probenahme von Abwesenheitsdaten verwendet wird.

Die ROC-Kurven und statistischen Maße wurden häufig zur Genauigkeitsbewertung verwendet, während die Konsistenz und Erwünschtheit der Karte häufig ignoriert wird12,21,25,31. Sowohl die Genauigkeit als auch die Konsistenz sollten bei der Kartierung der Erdrutschanfälligkeit bewertet werden, da eine Karte ihre Konsistenz verlieren kann, wenn die klassifizierten Gebiete von Zonen mit hoher und sehr hoher Anfälligkeit kontinuierlich erweitert werden, um eine hohe Genauigkeit zu erreichen26. Unsere Studie hat gezeigt, dass unsere vorgeschlagene MD-basierte Probenahmemethode die Erdrutschanfälligkeitskarte mit zufriedenstellender Genauigkeit und Konsistenz erstellt. Im Gegensatz dazu kann die neigungsbasierte Probenahme die Konsistenz beeinträchtigen, indem die meisten Gebiete als Zonen mit hoher Anfälligkeit klassifiziert werden12,25.

Wie bereits erwähnt, ist die Zufallsstichprobe die gebräuchlichste Methode zur Erhebung von Abwesenheitsdaten20. In diesem Fall besteht jedoch eine hohe Wahrscheinlichkeit, dass Abwesenheitsdaten aus einem Gebiet erfasst werden, das sehr anfällig für Erdrutsche ist oder in Gebieten, in denen es zuvor zu Erdrutschen kam. Darüber hinaus ist eine sehr detaillierte Bestandsaufnahme der Erdrutsche erforderlich, und in einigen Gebieten wie den Entwicklungsländern ist eine detaillierte Bestandsaufnahme nicht verfügbar. Für einen solchen Bereich wird unsere vorgeschlagene Methode hilfreich sein, da wir vor der Ausführung des auf MD basierenden statistischen oder maschinellen Lernmodells einen Bereich bestimmen, der für die Stichprobenentnahme von Abwesenheitsdaten sicher ist.

Unsere vorgeschlagene Methode reduziert die Subjektivität bei der Auswahl des Schwellenwerts, indem sie die MD-Werte mit der Chi-Quadrat-Verteilung vergleicht und ein weit verbreitetes statistisches Konfidenzniveau anwendet. Im Gegensatz dazu ist die Bestimmung der Steigungsschwelle subjektiv. Daher ist unsere vorgeschlagene Methode statistisch robuster und wissenschaftlich praktikabler als die steigungsbasierte Stichprobe.

In dieser Studie wurde eine objektive MD-basierte Methode zur Erfassung von Abwesenheitsdaten zur Kartierung der Erdrutschanfälligkeit vorgeschlagen. Wir verglichen unsere vorgeschlagene Methode mit einer häufig verwendeten, neigungsbasierten Abwesenheitsdatenstichprobe bei der Erstellung von Karten zur Anfälligkeit für Erdrutsche auf der Grundlage eines zufälligen Waldmodells. Unsere Ergebnisse zeigen, dass die mit der MD-basierten Methode erstellte Erdrutschanfälligkeitskarte hinsichtlich Genauigkeit und Konsistenz zufriedenstellend ist. Unser vorgeschlagener Ansatz ist weniger subjektiv, da der kritische Wert auf der Grundlage einer Chi-Quadrat-Verteilung und eines vom Benutzer angegebenen Signifikanzniveaus bestimmt wurde. Andererseits ist die steigungsbasierte Stichprobe subjektiv und führt zu einem voreingenommenen Modell in Richtung der Steigung. Wir empfehlen, die Steigung aus dem Modell auszuschließen, wenn sie bei der Stichprobenentnahme mit Abwesenheitsdaten verwendet wird. Obwohl die neigungsbasierte Methode hinsichtlich der AUC eine nahezu ähnliche Genauigkeit für die Karte der Erdrutschanfälligkeit liefert, deuten die SCAI-Werte darauf hin, dass diese Methode die Erdrutschanfälligkeit überschätzt. Darüber hinaus zeigten die Kappa-Werte auch, dass die MD-basierte Erfassung von Abwesenheitsdaten eine bessere Leistung liefert. Die steigungsbasierte Methode zur Erfassung von Abwesenheitsdaten hängt vom Urteil des Forschers ab und basiert auf einem ursächlichen Erdrutschfaktor. Im Gegensatz dazu werden bei der MD-basierten Abwesenheitsdatenstichprobe mehrere Faktoren verwendet, um den Stichprobenraum zu bestimmen. Daher ist unsere vorgeschlagene MD-basierte Stichprobenmethode objektiver und statistisch robuster als die steigungsbasierte Methode. Es kann für die Kartierung der Erdrutschanfälligkeit in anderen Gebieten verwendet werden, insbesondere dort, wo der Erdrutschbestand nicht für die gesamte Region repräsentativ ist.

Auf Anfrage an die Autoren ist der Code für die Mahalanobis-Distanzmethode unter https://github.com/yrabby/Mahalanobis-Distance-for-Raster-Files verfügbar. https://doi.org/10.3390/data5010004.

Cruden, DM & Varnes, DJ Erdrutsche: Untersuchung und Schadensbegrenzung. Kapitel 3 – Arten und Prozesse von Erdrutschen. Sonderbericht des Transportation Research Board (247) (1996).

Ahmed, B. & Dewan, A. Anwendung bivariater und multivariater statistischer Techniken bei der Modellierung der Anfälligkeit für Erdrutsche in der Stadtgesellschaft Chittagong, Bangladesch. Remote Sens. 9(4), 304 (2017).

Artikel ADS Google Scholar

Guzzetti, F. Gefahrenbewertung und Risikobewertung von Erdrutschen: Grenzen und Perspektiven. In Proceedings of the 4th EGS Plinius Conference 2–4 (2002).

Yilmaz, I. Kartierung der Anfälligkeit für Erdrutsche unter Verwendung von Frequenzverhältnissen, logistischer Regression, künstlichen neuronalen Netzen und deren Vergleich: eine Fallstudie von Kat-Erdrutschen (Tokat – Türkei). Berechnen. Geosci. 35(6), 1125–1138 (2009).

Artikel ADS Google Scholar

Yilmaz, I. Vergleich der Methoden zur Kartierung der Erdrutschanfälligkeit für Koyulhisar, Türkei: bedingte Wahrscheinlichkeit, logistische Regression, künstliche neuronale Netze und Support-Vektor-Maschine. Umgebung. Erdwissenschaft. 61(4), 821–836 (2010).

Artikel CAS ADS Google Scholar

Ahmed, B. Erdrutschanfälligkeitsmodellierung unter Verwendung benutzerdefinierter Gewichtung und datengesteuerter statistischer Techniken in der Gemeinde Cox's Bazar, Bangladesch. Nat. Hazards 79(3), 1707–1737 (2015).

Artikel Google Scholar

Chen, W. et al. Modellierung der Anfälligkeit für Erdrutsche mithilfe von GIS-basierten Techniken des maschinellen Lernens für den Kreis Chongren, Provinz Jiangxi, China. Wissenschaft. Gesamtumgebung. 626, 1121–1135 (2018).

Artikel CAS ADS Google Scholar

Hong, H. et al. Kartierung der Anfälligkeit für Erdrutsche mithilfe des J48-Entscheidungsbaums mit AdaBoost-, Bagging- und Rotation Forest-Ensembles in der Region Guangchang (China). CATENA 163, 399–413 (2018).

Artikel Google Scholar

Ahmed, B. et al. Entwicklung eines dynamischen Web-GIS-basierten Erdrutsch-Frühwarnsystems für die Metropolregion Chittagong, Bangladesch. ISPRS Int. J. Geo-Inf. 7(12), 485 (2018).

Artikel Google Scholar

Guzzetti, F., Reichenbach, P., Ardizzone, F., Cardinali, M. & Galli, M. Schätzung der Qualität von Erdrutschanfälligkeitsmodellen. Geomorphologie 81(1–2), 166–184 (2006).

Artikel ADS Google Scholar

Sterlacchini, S., Ballabio, C., Blahut, J., Masetti, M. & Sorichetta, A. Räumliche Übereinstimmung vorhergesagter Muster in Erdrutsch-Anfälligkeitskarten. Geomorphology 125(1), 51–61 (2011).

Artikel ADS Google Scholar

Althuwaynee, OF, Pradhan, B., Park, HJ & Lee, JH Ein neuartiges Ensemble bivariater statistischer Beweisglaubensfunktionen mit wissensbasiertem analytischem Hierarchieprozess und multivariater statistischer logistischer Regression für die Kartierung der Erdrutschanfälligkeit. CATENA 114, 21–36 (2014).

Artikel Google Scholar

Althuwaynee, OF, Pradhan, B. & Lee, S. Ein neuartiges integriertes Modell zur Bewertung der Erdrutschanfälligkeitskartierung mithilfe des paarweisen Vergleichs von CHAID und AHP. Int. J. Remote Sens. 37(5), 1190–1209 (2016).

Artikel Google Scholar

Reichenbach, P., Mondini, AC & Rossi, M. Der Einfluss von Landnutzungsänderungen auf die Zoneneinteilung der Erdrutschanfälligkeit: Das Briga-Einzugsgebiet-Testgelände (Messina, Italien). Umgebung. Verwalten. 54(6), 1372–1384 (2014).

Artikel CAS ADS Google Scholar

Ayalew, L. & Yamagishi, H. Die Anwendung der GIS-basierten logistischen Regression zur Kartierung der Erdrutschanfälligkeit im Kakuda-Yahiko-Gebirge, Zentraljapan. Geomorphologie 65(1–2), 15–31 (2005).

Artikel ADS Google Scholar

Vakhshoori, V. & Zare, M. Kartierung der Anfälligkeit für Erdrutsche durch Vergleich von Beweiskraft-, Fuzzy-Logik- und Häufigkeitsverhältnismethoden. Geomat. Nat. Gefahr. Risiko 7(5), 1731–1752 (2016).

Artikel Google Scholar

Reichenbach, P., Rossi, M., Malamud, BD, Mihir, M. & Guzzetti, F. Eine Übersicht über statistisch basierte Erdrutschanfälligkeitsmodelle. Erdwissenschaft. Rev. 180, 60–91 (2018).

Artikel ADS Google Scholar

Zhu, AX et al. Ein auf Expertenwissen basierender Ansatz zur Kartierung der Erdrutschanfälligkeit mithilfe von GIS und Fuzzy-Logik. Geomorphologie 214, 128–138 (2014).

Artikel ADS Google Scholar

Tsangaratos, P. & Benardos, A. Abschätzung der Anfälligkeit für Erdrutsche mithilfe eines künstlichen neuronalen Netzwerkklassifikators. Nat. Hazards 74(3), 1489–1516 (2014).

Artikel Google Scholar

Regmi, AD et al. Anwendung von Häufigkeitsverhältnis-, statistischen Index- und Beweiskraftmodellen und deren Vergleich bei der Kartierung der Erdrutschanfälligkeit im Zentralnepal-Himalaya. Araber. J. Geosci. 7(2), 725–742 (2014).

Artikel Google Scholar

Zhu, AX et al. Ein auf Ähnlichkeit basierender Ansatz zum Sammeln von Abwesenheitsdaten für die Kartierung der Erdrutschanfälligkeit mithilfe datengesteuerter Methoden. CATENA 183, 104188 (2019).

Artikel Google Scholar

Adnan, MSG et al. Verbesserung der räumlichen Übereinstimmung bei der auf maschinellem Lernen basierenden Kartierung der Erdrutschanfälligkeit. Remote Sens. 12(20), 3347 (2020).

Artikel ADS Google Scholar

Yao, Geomorphology 101(4), 572–582 (2008).

Artikel ADS Google Scholar

Hong, H., Miao, Y., Liu, J. & Zhu, AX Untersuchung der Auswirkungen des Designs und der Menge von Abwesenheitsdaten auf die Leistung zufälliger waldbasierter Erdrutschanfälligkeitskartierung. CATENA 176, 45–64 (2019).

Artikel Google Scholar

Abedini, M. & Tulabi, S. Bewertung von LNRF-, FR- und AHP-Modellen im Erdrutsch-Anfälligkeitskartierungsindex: Eine vergleichende Studie des Wassereinzugsgebiets Nojian in der Provinz Lorestan, Iran. Umgebung. Erdwissenschaft. 77(11), 1–13 (2018).

Artikel Google Scholar

Schicker, R. & Moon, V. Vergleich bivariater und multivariater statistischer Ansätze bei der Kartierung der Erdrutschanfälligkeit auf regionaler Ebene. Geomorphologie 161, 40–57 (2012).

Artikel ADS Google Scholar

Nader, P., Honeine, P. & Beauseroy, P. Mahalanobis-basierte Ein-Klassen-Klassifizierung. Im Jahr 2014 IEEE International Workshop on Machine Learning for Signal Processing (MLSP) 1–6. IEEE (2014).

Prabhakaran, S., 2020. Mahalanobis Distance – Mathematik anhand von Beispielen verstehen (Python) – ML+.[online] ML+. https://www.machinelearningplus.com/statistics/mahalanobis-distance/ [Zugriff am 8. April 2020].

Abedin, J., Rabby, YW, Hasan, I. & Akter, H. Eine Untersuchung der Merkmale, Ursachen und Folgen der Erdrutsche vom 13. Juni 2017 im Bezirk Rangamati in Bangladesch. Geoumgebung. Katastrophe. 7(1), 1–19 (2020).

Artikel Google Scholar

Statistikamt von Bangladesch (BBS). Volkszählung 2011 (Planungsministerium, 2011).

Google Scholar

Rabby, YW, Hossain, MB & Abedin, J. Kartierung der Anfälligkeit für Erdrutsche in drei Upazilas im Distrikt Rangamati Hill in Bangladesch: Anwendung und Vergleich GIS-basierter Methoden des maschinellen Lernens 1–24 (Geocarto International, 2020).

Google Scholar

Rabby, YW & Li, Y. Ein integrierter Ansatz zur Kartierung von Erdrutschen in Chittagong Hilly Areas, Bangladesch, mithilfe von Google Earth und Feldkartierung. Erdrutsche 16(3), 633–645 (2019).

Artikel Google Scholar

Rahman, MS, Ahmed, B. & Di, L. Erdrutschinitiierung und Runout-Anfälligkeitsmodellierung im Kontext von Bergabholzung und schneller Urbanisierung: Ein kombinierter Ansatz aus Beweisgewichten und räumlichen Multikriterien. J. Mt. Sci. 14(10), 1919–1937 (2017).

Artikel Google Scholar

Kanwal, S., Atif, S. & Shafiq, M. GIS-basierte Erdrutschanfälligkeitskartierung nördlicher Gebiete Pakistans, eine Fallstudie der Shigar- und Shyok-Becken. Geomat. Nat. Gefahr. Risiko 8(2), 348–366 (2017).

Artikel Google Scholar

Chen, W. et al. Neuartiger hybrider künstlicher Intelligenzansatz eines bivariaten, auf statistischen Methoden basierenden Kernel-Logistik-Regressionsklassifikators für die Modellierung der Erdrutschanfälligkeit. Stier. Ing. Geol. Env. 78(6), 4397–4419 (2019).

Artikel Google Scholar

Althuwaynee, OF, Pradhan, B., Park, HJ & Lee, JH Ein neuartiges Ensemble-Entscheidungsbaum-basiertes Chi-Quadrat-Automatisches-Interaktions-Erkennen (CHAID) und multivariate logistische Regressionsmodelle bei der Kartierung der Erdrutschanfälligkeit. Erdrutsche 11(6), 1063–1078 (2014).

Artikel Google Scholar

Ali, SA et al. GIS-basierte Erdrutschanfälligkeitsmodellierung: Ein Vergleich zwischen Fuzzy-Multikriterien- und maschinellen Lernalgorithmen. Geosci. Vorderseite. 12(2), 857–876 (2021).

Artikel Google Scholar

Breiman, L. Zufällige Wälder. Mach. Lernen. 45(1), 5–32 (2001).

Artikel MATH Google Scholar

James, G., Witten, D., Hastie, T. & Tibshirani, R. An Introduction to Statistical Learning Vol. 112, 18 (Springer, 2013).

Buchen Sie MATH Google Scholar

Pham, BT et al. Ein neuartiger Hybridansatz zur Modellierung der Erdrutschanfälligkeit unter Verwendung eines Rotationswaldensembles und verschiedener Basisklassifikatoren. Geocarto Int. 35(12), 1267–1292 (2020).

Artikel Google Scholar

Youssef, AM, Pourghasemi, HR, Pourtaghi, ZS & Al-Katheeri, MM Erdrutsch-Anfälligkeitskartierung unter Verwendung von Random Forest, Boosted Regression Tree, Klassifizierungs- und Regressionsbaum sowie allgemeinen linearen Modellen und Vergleich ihrer Leistung im Wadi Tayyah Basin, Region Asir, Saudi-Arabien. Erdrutsche 13(5), 839–856 (2016).

Artikel Google Scholar

Liaw, A. & Wiener, M. Klassifizierung und Regression durch randomForest. R News 2(3), 18–22 (2002).

Google Scholar

Kissell, R. & Poserina, J. Optimal Sports Math, Statistics, and Fantasy (Academic Press, 2017).

Google Scholar

Rasyid, AR, Bhandary, NP & Yatabe, R. Leistung des Häufigkeitsverhältnisses und des logistischen Regressionsmodells bei der Erstellung einer GIS-basierten Anfälligkeitskarte für Erdrutsche am Berg Lompobattang, Indonesien. Geoumgebung. Katastrophe. 3(1), 19 (2016).

Artikel Google Scholar

Süzen, ML & Doyuran, V. Ein Vergleich der GIS-basierten Methoden zur Bewertung der Erdrutschanfälligkeit: Multivariat versus Bivariat. Umgebung. Geol. 45(5), 665–679 (2004).

Artikel Google Scholar

Arabameri, A. et al. Vergleich von Modellen des maschinellen Lernens für die Kartierung der Anfälligkeit für Gully-Erosion. Geosci. Vorderseite. 11(5), 1609–1620 (2020).

Artikel Google Scholar

Sdao, F., Lioi, DS, Pascale, S., Caniani, D. & Mancini, IM Bewertung der Anfälligkeit für Erdrutsche mithilfe eines Neuro-Fuzzy-Modells: Eine Fallstudie im felsigen Kulturerbegebiet von Matera. Nat. Gefahren Erdsystem 13(2), 395–407 (2013).

Artikel ADS Google Scholar

Budimir, MEA, Atkinson, PM & Lewis, HG Eine systematische Überprüfung der Kartierung der Erdrutschwahrscheinlichkeit mithilfe logistischer Regression. Erdrutsche 12(3), 419–436 (2015).

Artikel Google Scholar

Referenzen herunterladen

Dieses Projekt wurde durch McClure-Stipendien und Penley Thomas-Stipendienprogramme der University of Tennessee, Knoxville, finanziert.

Fakultät für Ingenieurwissenschaften, Wake Forest University, Winston-Salem, NC, USA

Yasin Wahid Rabbi

Institut für Geographie und Nachhaltigkeit, University of Tennessee, Knoxville, USA

Yingkui Li

Abteilung für Unternehmensanalyse und Statistik, University of Tennessee, Knoxville, USA

Haileab Hilafu

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

YWR: Konzeptualisierung, Methodik, Schreiben – Vorbereitung des Originalentwurfs; YL: Supervision, Schreiben-Rezensieren und Bearbeiten; HH: Betreuung, Schreiben-Rezensieren und Lektorieren.

Korrespondenz mit Yasin Wahid Rabby.

Die Autoren geben an, dass keine Interessenkonflikte bestehen.

Springer Nature bleibt neutral hinsichtlich der Zuständigkeitsansprüche in veröffentlichten Karten und institutionellen Zugehörigkeiten.

Open Access Dieser Artikel ist unter einer Creative Commons Attribution 4.0 International License lizenziert, die die Nutzung, Weitergabe, Anpassung, Verbreitung und Reproduktion in jedem Medium oder Format erlaubt, sofern Sie den/die ursprünglichen Autor(en) und die Quelle angemessen angeben. Geben Sie einen Link zur Creative Commons-Lizenz an und geben Sie an, ob Änderungen vorgenommen wurden. Die Bilder oder anderes Material Dritter in diesem Artikel sind in der Creative-Commons-Lizenz des Artikels enthalten, sofern in der Quellenangabe für das Material nichts anderes angegeben ist. Wenn Material nicht in der Creative-Commons-Lizenz des Artikels enthalten ist und Ihre beabsichtigte Nutzung nicht durch gesetzliche Vorschriften zulässig ist oder über die zulässige Nutzung hinausgeht, müssen Sie die Genehmigung direkt vom Urheberrechtsinhaber einholen. Um eine Kopie dieser Lizenz anzuzeigen, besuchen Sie http://creativecommons.org/licenses/by/4.0/.

Nachdrucke und Genehmigungen

Rabby, YW, Li, Y. & Hilafu, H. Eine objektive Methode zur Erfassung von Abwesenheitsdaten zur Kartierung der Anfälligkeit für Erdrutsche. Sci Rep 13, 1740 (2023). https://doi.org/10.1038/s41598-023-28991-5

Zitat herunterladen

Eingegangen: 06. Januar 2022

Angenommen: 27. Januar 2023

Veröffentlicht: 31. Januar 2023

DOI: https://doi.org/10.1038/s41598-023-28991-5

Jeder, mit dem Sie den folgenden Link teilen, kann diesen Inhalt lesen:

Leider ist für diesen Artikel derzeit kein Link zum Teilen verfügbar.

Bereitgestellt von der Content-Sharing-Initiative Springer Nature SharedIt

Bulletin für Ingenieurgeologie und Umwelt (2023)

Durch das Absenden eines Kommentars erklären Sie sich damit einverstanden, unsere Nutzungsbedingungen und Community-Richtlinien einzuhalten. Wenn Sie etwas als missbräuchlich empfinden oder etwas nicht unseren Bedingungen oder Richtlinien entspricht, kennzeichnen Sie es bitte als unangemessen.