Ich habe eine servletbasierte Anwendung, in der ich die Zeit messe, die zum Abschließen jeder Anforderung an dieses Servlet benötigt wird. Ich berechne bereits einfache Statistiken wie den Mittelwert und das Maximum. Ich möchte jedoch eine differenziertere Analyse erstellen, und dazu muss ich diese Reaktionszeiten meines Erachtens richtig modellieren.
Ich sage, die Antwortzeiten folgen mit Sicherheit einer bekannten Verteilung, und es gibt gute Gründe zu der Annahme, dass die Verteilung das richtige Modell ist. Ich weiß jedoch nicht, wie diese Distribution aussehen soll.
Log-normal und Gamma kommen in den Sinn, und Sie können entweder eine Art von realen Antwortzeitdaten anpassen. Hat jemand eine Sicht auf welche Verteilung die Antwortzeiten folgen sollen?
quelle
Meine Forschung zeigt, dass das beste Modell durch ein paar Dinge bestimmt wird: 1) Interessieren Sie sich für den Körper, den Schwanz oder für beides? Ist dies nicht "beides", kann die Modellierung eines gefilterten Datensatzes nützlicher sein. 2) Möchten Sie eine sehr einfache oder eine sehr genaue? dh wie viele Parameter?
Wenn die Antwort auf 1 "beide" und 2 "einfach" war, scheint Pareto am besten zu funktionieren. Andernfalls, wenn 1 "body" und 2 "simple" war, wählen Sie ein gefiltertes Langmodell. Wenn 1 "beides" und 2 "genau" war, möchten Sie wahrscheinlich ein Gaußsches Mischungsmodell für Ihre Daten in der Protokolldomäne - quasi eine logarithmische Anpassung.
Ich habe in letzter Zeit nachgeforscht und das Thema im öffentlichen Internet nicht gut genug gefunden. Deshalb habe ich gerade einen Blog-Beitrag geschrieben, in dem meine Nachforschungen zu diesem Thema aufgeführt sind.
quelle