Wir haben eine neue Synology RS3412RPxs, die iSCSI-Ziele für drei Windows 2008 R2-Boxen und NFS für eine OpenBSD 5.0-Box bietet.
Wenn Sie sich mit ssh beim RS3412 anmelden und sowohl kleine Dateien als auch 6-GB-Dateien mit dd und verschiedenen Blockgrößen lesen / schreiben, zeigen Sie eine hervorragende Festplatten-E / A-Leistung.
Mit dd oder iometer auf den iSCSI / NFS-Clients erreichen wir bis zu 20 Mbit / s (das ist kein Tippfehler. Zwanzig Mbit / s). Wir hatten gehofft, die mehreren Gbit-NICs in der Synology besser nutzen zu können.
Ich habe überprüft, ob die Switch- und NIC-Port-Konfiguration auf Gigabit eingestellt ist und nicht automatisch ausgehandelt wird. Wir haben es mit und ohne Jumboframes ohne Unterschied versucht. Ich habe mit Ping überprüft, dass die MTU derzeit 9000 ist. Zwei Firmware-Upgrades wurden bereitgestellt.
Ich werde versuchen, eine direkte Verbindung zwischen dem iSCSI-Ziel und dem Initiator herzustellen, um Switch-Probleme auszuschließen. Aber was sind meine anderen Optionen?
Wonach suche ich, wenn ich wireshark / tcpdump ausbreche?
quelle
Antworten:
Schauen Sie sich die Einstellungen für die Flusskontrolle an den Schaltern noch einmal an, da dies hier das häufig verwendete Thema zu sein scheint. Wenn die Switches über Ethernet-Zählerstatistiken verfügen, überprüfen Sie diese und prüfen Sie, ob eine große Anzahl von Ethernet-PAUSE-Frames vorhanden ist. Wenn ja, ist das wahrscheinlich Ihr Problem. Im Allgemeinen wird dieses Problem durch Deaktivieren von QOS auf den Switches behoben.
quelle
Solche Flows deuten darauf hin, dass die verschiedenen TCP-Flow-Control-Methoden nicht richtig funktionieren. Ich habe einige Probleme mit Linux-Kerneln gesehen, die mit Windows-Versionen nach Vista sprechen, und Sie erhalten solche Durchsätze. Sie tauchen in Wireshark ziemlich gut auf, wenn Sie einen Blick darauf werfen.
Die absolut schlimmste Möglichkeit ist, dass die TCP-verzögerte Bestätigung vollständig unterbrochen ist und Sie ein Verkehrsmuster sehen, das wie folgt aussieht:
Ich habe dieses Problem gelöst, indem ich NIC-Treiber-Updates auf die Windows-Server angewendet habe. Die intelligenten Netzwerkkarten, die mit einigen (Broadcom-) Servern geliefert werden, können manchmal auf interessante Weise ausfallen, und dies ist eine.
Ein normales Verkehrsmuster wäre eine große Anzahl von Paketen, gefolgt von einem Ack-Paket.
Das andere, wonach man suchen muss, sind lange Verzögerungen. Verdächtige Werte sind 0,2 Sekunden und 1,0 Sekunden. Dies deutet darauf hin, dass eine Seite nicht das bekommt, was sie erwartet, und darauf wartet, dass eine Zeitüberschreitung abläuft, bevor sie antwortet. Kombinieren Sie das oben genannte fehlerhafte Paketmuster mit einer Verzögerung von 200 ms für die ACK und Sie erhalten Durchsätze von satten 1 MB / s.
Das sind die leicht zu erkennenden schlechten Verkehrsmuster.
Ich habe nicht mit dieser Art von NAS-Gerät gearbeitet, weiß also nicht, wie optimierbar es ist, das zu reparieren, was gefunden wird.
quelle