Wir haben eine NFS 4-Freigabe, die ein Volume zwischen mehreren Servern (NFS-Server und Clients alle Debian 8) teilt. In letzter Zeit gab es einige Probleme, bei denen Netzwerkausfälle die Clientsysteme einfrierten.
Unsere NFS Optionen waren minimal, nur rw
(und so die Standardwerte hard
, fg
usw.).
Ich experimentiere jetzt mit diesen Optionen, bekomme aber nicht das Verhalten, das ich erwarte:
rw,soft,bg,retrans=6,timeo=150
(Ich habe die Neuübertragungen erhöht, um einen Teil des weichen Risikos auszugleichen.)
Das Verfahren, das ich zum Testen befolge, ist:
- Maschine booten
cd
zu/mnt/mountpoint
- Überprüfen Sie, ob die NFS-Verbindung in Ordnung ist
cd /
- Netzwerk töten
ifdown eth0
cd
zu/mnt/mountpoint
ls
Zu diesem Zeitpunkt friert die Befehlszeile ein und ich kann sie nicht unterbrechen. Nach einiger Zeit wird die Meldung "nfs: server [servername] antwortet nicht, Zeitüberschreitung" angezeigt, die sich scheinbar einmal pro Minute (auf unbestimmte Zeit) wiederholt.
Was ich möchte / erwarten würde, damit die Operation fehlschlägt und die Kontrolle zurückgegeben wird.
Könnte mir bitte jemand sagen, wo ich mit diesen Einstellungen falsch liege?
(PS: Ich habe auch versucht, mit Autofs zu mounten, sah aber ein ähnliches Verhalten)
Vielen Dank
soft
auf keinen Fall empfehlen . Es ermöglicht das Verwerfen von Daten im Fehlerfall . Stattdessen würde ich vorschlagenhard,intr
.hard
für uns genauso schlimm ist (Systeme sterben und bleiben tot, bis sie neu gestartet werden).intr
wird in NFS4 laut man nicht unterstützt.intr
es von NFS4 unterstützt wird, aber nicht von Kerneln> 2.6.25)cd
, aber stattdessen zu tunls /mnt/mountpoint
? Es ist möglich, dassls
Ihre Shell nach dem Fehlschlagen versucht, Dateisystemoperationen durchzuführen, die von PWD abhängig sind. (Noch schlimmer, wenn Sie dumm genug waren, um.
Ihre$PATH
Antworten:
intr
sollte es dir ermöglichen, die Kontrolle wieder zu erlangen, wenn du schlägst^C
, aber normalerweise nicht sofort.Wie Sie sagen, sind hier die Erwartungen das Problem. Netzwerkprobleme können vorübergehend sein, das Fehlschlagen eines Vorgangs ist jedoch dauerhaft. Daher blockieren die meisten Vorgänge standardmäßig nur, bis der Vorgang abgeschlossen ist.
Dies ist die Standardantwort, aber wenn ich mir eine aktuelle Manpage ansehe, sehe ich Folgendes:
Es scheint mir also kein NFS3 / NFS4-Problem zu sein, sondern eine Entscheidung darüber, wie es
intr
funktioniert. Sie sollten also in der Lage sein,KILL
den Vorgang auszuführen, aber das kann Ihnen nicht viel Nutzen bringen.Ich konnte die Diskussion darüber, warum die Option entfernt wurde, nicht finden. Kannst du deinen Prozess töten?
quelle
intr
wird von nfs 2/3 aber nicht 4 unterstützt.Ein Teil meiner Antwort ist eine auf Erfahrung basierende Meinung. Wo ich Fakten habe, werde ich (versuche mich daran zu erinnern) auf sie verlinken.
soft
unter fast keinen Umständen empfehlen . Es ermöglicht das Verwerfen von Daten im Fehlerfall . Stattdessen würde ich vorschlagenhard,intr
.intr
ist dies nicht für NFS 4 gültig, aber es scheint, dass dies eher eine Kerneländerung als eine NFS- Änderung ist .autofs
) eignet sich gut für meine Anwendungsfälle mit den NFS-Versionen 2 und 3 und hilft dabei, meine Client-Systeme vor Server-Fehlern zu schützen, indem die NFS-Dateisysteme nur bereitgestellt werden, wenn sie benötigt werden.Mein Vorschlag an Sie wäre, einen Wechsel von NFS 4 zu NFS 3 in Betracht zu ziehen und zu prüfen, ob dies für Ihren speziellen Anwendungsfall hilfreich ist. Betrachten Sie es nicht als eine Herabstufung.
quelle
intr
wird es in den neuesten Kernelversionen nicht unterstützt.intr
es in NFS4 unterstützt wird (es ist sowohl in den Optionen 2/3 als auch in den 4 Optionen in man aufgeführt, was ein bisschen verwirrend ist), aber es wird nur in neueren Kernelversionen nicht unterstützt.hard
fällt die gesamte Website aus. Wenn wir verwendensoft
, erhalten wir möglicherweise einige fehlerhafte Bilder (obwohl unser Caching-System dies fast vollständig abschwächt). Das Risikosoft
, Dateibeschädigungen zuzulassen, ist wirklich nicht so groß. Ich hätte lieber eine beschädigte Bilddatei als eine heruntergekommene Site!soft
mit einer akzeptablen Lösung zufrieden gegeben. Antwort geändert von "nie" zu "fast nie". Vielen Dank!