Ich arbeite derzeit an Schätzungen der Biomasse mithilfe von Satellitenbildern. Ich werde schnell den Hintergrund meiner Frage definieren und dann die statistische Frage erklären, an der ich arbeite.
Hintergrund
Problem
Ich versuche, die Biomasse in einem Gebiet in Frankreich abzuschätzen. Meine Antwort ist die Dampfholzvolumendichte (in ), die mehr oder weniger proportional zur Biomasse ist (abhängig von der Holzdichte ...).
Die unabhängigen Variablen, die ich habe, sind Vegetationsindizes, die aus gemessenen Reflexionsgraden über diesem Gebiet abgeleitet wurden (der in der Studie verwendete Satellit ist MODIS für diejenigen, die ihn kennen). Diese Indizes sind zum Beispiel NDVI, EVI usw. Ich habe Karten der Indizes und die Auflösung der Karten beträgt 250 m.
Es gibt starke Korrelationen zwischen diesen Indizes und dem Volumen in demselben Waldtyp (Biom und Klima). Ich versuche also, die Volumendichte gegen diese Indikatoren (eigentlich ihre Zeitreihen) in Inventardiagrammen zu regressieren, in denen ich das Volumen kenne.
Waldinventare
Das Volumen auf diesen Parzellen wird mit der folgenden Stichprobenmethode geschätzt:
- Inventarknoten werden in einem regelmäßigen Raster platziert, das den Bereich abdeckt.
- Jedem Knoten ist ein Diagramm zugeordnet, und der Inventarisierungsprozess (Baumtypen, Volumen, Überdachungshöhe usw.) erfolgt auf diesem Diagramm. Natürlich interessiert mich nur das Inventardiagramm und die Werte meiner Vegetationsindizes sind der Wert des Pixels, das das Diagramm enthält.
Der Inventarisierungsprozess auf einem Grundstück ist wie folgt:
- Maß der Bäume mit einem Durchmesser> 37,5 cm im Kreis mit einem Radius von 15 m
- Maß der Bäume mit einem Durchmesser> 22,5 cm im Kreis mit 9 m Radius
- Maß der Bäume mit einem Durchmesser> 7,5 cm im Kreis mit 6 m Radius
Die Volumendichte wird dann unter Verwendung von Expansionsfaktoren berechnet.
Für jedes Grundstück habe ich Zugriff auf die Daten aller gemessenen Bäume.
Darüber hinaus habe ich für jeden einzelnen Baum aufgrund der Verwendung allometrischer Gleichungen eine Unsicherheit über das Volumen (sagen wir 10%).
Wo Statistiken wichtig sind ...
Damit meine Regressionen genauer sind, benötige ich für jede Volumenschätzung die Varianz / den CI dieses Maßes. Dies hängt, IMO, von der Anzahl der untersuchten Bäume und der gefundenen Volumendichte ab.
Ich habe also zwei Probleme:
Wie kann ich die Tatsache berücksichtigen, dass meine Vegetationsindizes über ein Pixel von 250 m gemessen werden?
Ich kann davon ausgehen, dass die Volumendichte über ein Pixel konstant ist und dass ich dieses Pixel mit einem Inventardiagramm abtastet.
Wie kann ich die Variabilität meiner Volumendichte abschätzen?
Ich denke, ich könnte Bootstrapping für die Baumpopulation verwenden. Aber meine Gesamtzahl der gemessenen Bäume kann ziemlich klein sein (von 7 bis 20 ...). Wie kann ich außerdem berücksichtigen, dass ich die Bäume je nach Größe in verschiedenen Kreisen messe? Und wie sollte sich die Variabilität ändern, wenn ich ein ganzes Pixel betrachte?
Ich dachte auch, ich könnte eine Monte-Carlo-Simulation verwenden, um einen Wald zu simulieren, und dann diesen Wald zufällig mit Parzellen abtasten, um zu sehen, was los ist ...
Ich habe keinen starken statistischen Hintergrund, also bin ich ein bisschen verloren!