Serverlast hoch, CPU im Leerlauf. NFS die Ursache?

7

Ich stoße auf ein Szenario, in dem eine hohe Serverlast (manchmal über 20 oder 30) und eine sehr geringe CPU-Auslastung (98% Leerlauf) auftreten. Ich frage mich, ob diese Wartezustände als Teil einer NFS-Dateisystemverbindung auftreten. Folgendes sehe ich in VMStat

procs -----------memory---------- ---swap-- -----io---- --system-- -----cpu------
 r  b   swpd   free   buff  cache   si   so    bi    bo   in   cs us sy id wa st
 2  1      0 1298784      0      0    0    0    16     5    0    9  1  1 97  2  0
 0  1      0 1308016      0      0    0    0     0     0    0 3882  4  3 80 13  0
 0  1      0 1307960      0      0    0    0   120     0    0 2960  0  0 88 12  0
 0  1      0 1295868      0      0    0    0     4     0    0 4235  1  2 84 13  0
 6  0      0 1292740      0      0    0    0     0     0    0 5003  1  1 98  0  0
 4  0      0 1300860      0      0    0    0     0   120    0 11194  4  3 93  0  0
 4  1      0 1304576      0      0    0    0   240     0    0 11259  4  3 88  6  0
 3  1      0 1298952      0      0    0    0     0     0    0 9268  7  5 70 19  0
 3  1      0 1303740      0      0    0    0    88     8    0 8088  4  3 81 13  0
 5  0      0 1304052      0      0    0    0     0     0    0 6348  4  4 93  0  0
 0  0      0 1307952      0      0    0    0     0     0    0 7366  5  4 91  0  0
 0  0      0 1307744      0      0    0    0     0     0    0 3201  0  0 100  0  0
 4  0      0 1294644      0      0    0    0     0     0    0 5514  1  2 97  0  0
 3  0      0 1301272      0      0    0    0     0     0    0 11508  4  3 93  0  0
 3  0      0 1307788      0      0    0    0     0     0    0 11822  5  3 92  0  0

Nach allem, was ich sagen kann, wenn das IO steigt, steigen die Wartezeiten. Könnte NFS hier die Ursache sein oder sollte ich mir wegen etwas anderem Sorgen machen? Dies ist eine VPS-Box in einem Fibre-Channel-SAN. Ich würde denken, der Engpass wäre nicht das SAN. Bemerkungen?

Mech Software
quelle

Antworten:

9

Sie können versuchen, mit iostat zu bestimmen, welches Gerät die E / A-Wartezeit generiert:

# iostat -k -h -n 5

Weitere Informationen finden Sie auf der iostat-Manpage. nfs ist häufig Teil des Problems, insbesondere wenn Sie eine große Anzahl kleiner Dateien bereitstellen oder besonders viele Dateivorgänge ausführen. Sie können den NFS-Zugriff mithilfe der üblichen Mount-Optionen wie rsize = 32768, wsize = 32768 optimieren. Zu diesem Thema gibt es ein gutes Whitepaper von netapp: http://media.netapp.com/documents/tr-3183.pdf

Stellen Sie außerdem sicher, dass sich keine Tropfen auf der Netzwerkschnittstelle befinden.

hoffe das hilft

frank.

fen
quelle
Absolut fantastisch! Das war es einfach. Es zeigt NFS als das Gerät, was ich vermutet (oder gehofft) habe. Ich mache mir keine großen Sorgen um das NFS, da es ein Backup-Gerät für Offsite-Backups ist. Wenn das wartet, bin ich damit einverstanden. Nochmals vielen Dank für den Tipp, der genau die Art von Informationen war, nach denen ich gesucht habe.
Mech Software
0

Das Hinzufügen einer asynchronen Option zu / etc / export half mir, den Lastdurchschnitt in Normen zurückzubringen.

/mnt/dir      *(rw,async,pnfs,no_root_squash,no_subtree_check)
user395869
quelle