Was bedeutet die P99-Latenz? Ich höre immer wieder davon in Diskussionen über die Leistung einer Anwendung, konnte aber online keine Ressource finden, die darüber sprechen würde.
web-services
networking
web-applications
p99
maverik
quelle
quelle
Should
nichtwill
.Stellen Sie sich vor, Sie erfassen Leistungsdaten Ihres Dienstes und die folgende Tabelle enthält die Ergebnisse (die Latenzwerte sind fiktiv, um die Idee zu veranschaulichen).
Die P99-Latenz Ihres Dienstes beträgt 7 Sekunden. Nur 1% der Anfragen dauert länger. Wenn Sie also die P99-Latenz Ihres Dienstes verringern können, erhöhen Sie dessen Leistung.
quelle
Nehmen wir ein Beispiel von hier
Wir können also sagen, dass bei 99 Prozent der Webanfragen eine Latenz von 1,3 ms (ms / Mikrosekunden abhängig von den konfigurierten Systemlatenzmaßen) oder weniger festgestellt wurde. Wie @tranmq sagte, können wir die Leistung des Dienstes steigern, wenn wir die P99-Latenz des Dienstes verringern.
Und es ist auch erwähnenswert, dass p95, da es nur wenige Anforderungen gibt, p99 teurer macht als p95, z. B.) anfängliche Anforderungen, die den Cache aufbauen, Klassenobjekte aufwärmen, Threads initiieren ...
Schließlich; Bei unseren Messungen können etwa 1% Rauschen auftreten (z. B. Netzwerküberlastungen, Ausfälle, Dienstverschlechterungen), sodass die p99-Latenz ein guter Vertreter für praktisch den schlimmsten Fall ist. Und fast immer ist es unser Ziel, die p99-Latenz zu reduzieren.
quelle