Statistische Analyse verschwindender Adler

8

Zusammenfassung des Tag-Schicksals nach Tag-Modell

In Schottland werden Adler mit Satelliten-Tags vermisst, und die obige Tabelle zeigt das Schicksal der Tags nach Tag-Modell. Ich interessiere mich besonders für die Tags "Gestoppt - keine Fehlfunktion", da möglicherweise auch diese Vögel getötet und die Leichen und Tags entsorgt werden.

Ich habe gesehen, dass festgestellt wurde, dass diese Tabelle und diese Tabelle allein ein Beweis dafür sind, dass "selbst bei der entferntesten statistischen Analyse klar ist, dass es Beziehungen zwischen" Gestoppt - Keine Fehlfunktion "und der Art des verwendeten Tags gibt." Meine Frage ist also, kann dies Aussage gesichert werden?

42/135  (31%) tags stopped for all types 
 8/17   (47%) tags stopped for 80NS     
29/77   (38%) tags stopped for 70GPS    
 3/22   (14%) tags stopped for 105GPS   
 2/13   (15%) tags stopped for 70GSM    
 0/6     (0%) tags stopped for 95BTOGSM 

Ich denke also, dass die Aussage wahr ist, wenn die 80NS-Ausfallrate von 47% signifikant schlechter ist als der globale Durchschnitt von 31%. Und es wäre nicht wahr, wenn die Wahrscheinlichkeit, 8 Fehler in einer zufälligen Stichprobe von 17 Tags aus den 135 zu erhalten, tatsächlich ziemlich hoch wäre. Noch abstrakter: Wenn 42 schwarze und 93 weiße Bälle in einer Tasche wären und ich zufällig 17 auswählen würde, wie hoch ist die Wahrscheinlichkeit, dass ich 8 schwarze und 9 weiße auswählen würde?

Ich kann die Wahrscheinlichkeit, dass die ersten 8 schwarz sind, als (42/135) * (41/134) usw. berechnen, aber ich versuche nicht, die Wahrscheinlichkeit zu ermitteln, dass 8 der 17 schwarz sind


BEARBEITEN: Die Satelliten-Tags wurden über einen Zeitraum von 13 Jahren von 2004 bis 2016 an Vögeln angebracht. Diese Tabelle zeigt 131 Tags anstelle von 135. 4 Tags wurden ausgeschlossen, da sie den genauen Einsatzort von vier frühen Tags nicht ermitteln konnten.

Tag-Typ nach Tag-Jahr

Hier ist eine weitere Tabelle aus dem Bericht , die einige Daten zur Lebensdauer der 70GPS / 70GSM-Tags enthält:

Stoppte keine Fehlfunktion Tag Betriebsdauer

Colin
quelle
2
Colin, Ihrer Frage fehlt eine Schlüsselvariable: Zeit seit dem Anwenden des Tags. Es ist auch möglich, dass andere Variablen mit dem Tag-Modell verwechselt werden: Beispielsweise werden möglicherweise unterschiedliche Modelle für verschiedene Arten oder Vögel unterschiedlicher Größe verwendet, oder einige sind älter und andere jünger. Unter der Annahme, dass dies ein echtes Problem ist, sollten Sie in Betracht ziehen, solche Daten in Ihre Analyse einzubeziehen.
whuber
2
@Antoine Ich kann sehen, warum du gedacht hast, es wären Hausaufgaben, aber ich fürchte, ich bin jetzt zu alt für Hausaufgaben. Dies ist ein Problem der realen Welt, an dem ich interessiert bin. Teilweise, weil ich mich für Statistiken und den Missbrauch von Statistiken interessiere, und teilweise, weil ich die Verfolgung von Raubvögeln nicht mag. Es ist mein erster Beitrag im Statistikbereich des Stapelaustauschs. Wenn es unangemessen ist, entschuldige ich mich
Colin
5
Überhaupt nicht unangemessen! Wir haben nur eine Menge Leute, die ihre Hausaufgaben einfügen und anscheinend erwarten, dass wir sie für sie beantworten, also gibt es eine gewisse Sensibilität dafür. Aber als ECHTE Frage ist dies definitiv ein Thema.
Jbowman
2
Wenn Sie nichts dagegen haben, lassen Sie den Zeitplan in. Es fügt der Frage interessante Herausforderungen hinzu. Wissen Sie, in welchen Jahren die Tags verloren gegangen sind? Im Idealfall können wir den entsprechenden Anhang, das Schicksal und den Typ für jedes Tag verbinden.
Gung - Reinstate Monica
1
Auf Ihre Frage: "Kann die Aussage gesichert werden?" Ich würde ja antworten, das kann es. Die Beziehung ist jedoch nicht kausal, es gibt offensichtliche Störfaktoren wie das Alter der Geräte, für die keine Kontrolle möglich ist. Auf jede Aussage "es ist offensichtlich, einen solchen und einen solchen Kausalzusammenhang zu sehen" muss man nicht mit einer richtigen kausalen Folgerung antworten, die die entgegengesetzte Schlussfolgerung zeigt. Man muss einfach eine verwirrende Variable finden, die die Identifizierung dieses Kausalzusammenhangs gefährdet. Wenn Ihr Ziel darin besteht, eine ordnungsgemäße kausale Folgerung durchzuführen, ist dies eine andere Geschichte.
dv_bn

Antworten:

0

Ich habe einen Weg gefunden, um zu meiner Antwort aus diesem Kommentar " Nachschlagen der hypergeometrischen Verteilung " auf math.stackexchange zu gelangen:

Aus dem Wikipedia-Eintrag zur hypergeometrischen Verteilung

In der Wahrscheinlichkeitstheorie und -statistik ist die hypergeometrische Verteilung eine diskrete Wahrscheinlichkeitsverteilung, die die Wahrscheinlichkeit von k Erfolgen (zufällige Ziehungen, für die das gezeichnete Objekt ein bestimmtes Merkmal aufweist) in n Zügen ohne Ersatz beschreibt.

Verwenden Sie dann einen Online- Hypergeometrie-Rechner und die folgenden Abbildungen:

Bevölkerung: 135

Anzahl der Erfolge in der Bevölkerung: 42

Stichprobengröße: 17

Anzahl der Erfolge in der Stichprobe: 8

Ich finde, dass die Wahrscheinlichkeit, genau 8 zu bekommen, 0,0703 beträgt und die Wahrscheinlichkeit, 8 oder mehr zu bekommen, 0,1095 beträgt

Ich denke, die Zahl "8 oder mehr" ist in diesem Fall die relevante, und ich muss sagen, dass diese Wahrscheinlichkeit geringer ist als meine vorhergesagte Intuition.

Die Zahlen deuten also darauf hin, dass die Ausfallrate bei einer Trennung nach Tag-Typ mit einer Wahrscheinlichkeit von 89% etwas anderes ist. Das bedeutet nicht , dass die Ursache für die Differenz ist der Tag - Typ.

Colin
quelle
1
Dies hat keinen Einfluss auf das Alter der Tags, was Zweifel an der Bedeutung oder Nützlichkeit der Wahrscheinlichkeit aufkommen lässt.
whuber
@whuber wir haben einen "Wissenschaftler", der behauptet, dass "bestimmte Tags viel höhere prozentuale Verluste haben (80NS bei 47%) [...] wenn wir nach Tags gehen, impliziert dies, dass es Tags und Kabelbäume geben könnte, die anfälliger für unbekannte Fehler sind als die rest "Das erste, was ich wissen wollte, war die Wahrscheinlichkeit, eine Ausfallrate von 47% zu erreichen, wenn wir davon ausgehen, dass alle Tags dieselbe Ausfallrate haben.
Colin
@whuber Eigentlich ist das Argument wahrscheinlich umstritten, denn wenn Sie den Originalbericht lesen, wird der 80NS in der Diskussion über die Zuverlässigkeit von Tags weitgehend ignoriert, und der Fall, dass die Ergebnisse "keine Fehlfunktion gestoppt" vorliegen, beruhen größtenteils auf der Verfolgung Beweise aus den 70GPS / GSM-Tags. Das 80NS-Modell wurde erst in den Anfangsjahren eingesetzt, gilt als weniger zuverlässig und verwendet ein Kabelbaumdesign, das eher vorzeitig fallen gelassen wird.
Colin