Verlängerung des PBS-Jobs

8

Es ist ziemlich schmerzhaft zu entdecken, dass ein ein paar Tage langer Job aufgrund eines Fehlers bei der Festlegung des Wandzeitlimits vorzeitig beendet wird.

Gibt es eine Möglichkeit, dies für einen laufenden PBS- Job zu ändern ?

mbq
quelle

Antworten:

9

Dies ist systemspezifisch, aber Sie suchen nach dem qalterBefehl.

Aron Ahmadia
quelle
1
Und normalerweise, wenn Sie keine Verwaltungsrechte auf diesem System haben, können Sie nur Ressourcen senken, was wahrscheinlich nicht das ist, was Sie wollen ...
FrenchKheldar
@FrenchKheldar Ich hatte den Eindruck, dass es ziemlich üblich ist, Benutzern dieses Privileg zu gewähren. Es kann natürlich verwendet werden, um die Warteschlange zu missbrauchen, aber es ist trivial, ein solches Verhalten zu verfolgen.
mbq
@mbq Ich denke, meine Erfahrung ist mit Regierungsmaschinen, auf denen es mehr Einschränkungen geben könnte als in anderen Umgebungen. Und als Benutzer, der immer nach Zugriff auf Rechenressourcen sucht, würde ich diese Art von Lücke auf jeden Fall untersuchen, wenn dies zulässig wäre. Dies bedeutet, dass Sie die Prioritätswarteschlange umgehen können, indem Sie weniger Ressourcen
anfordern
Interessant, ich dachte immer, ich qalterkönnte nur die Fristen verlängern, bevor der Job beginnt (was ich glaube, ich habe es in der Manpage gelesen).
David Z
2

Wenden Sie sich über Ihren Cluster an die IT-Administratoren. Ich kenne Leute, die andere Probleme hatten, wie zum Beispiel Jobs, die nicht beginnen. Nachdem unser IT-Administrator es herausgefunden hatte, kümmerten sie sich darum.

Christopher Bottoms
quelle
2

Für faule Leute:

qalter -l walltime=<new walltime> <jobid>
mbq
quelle
2

alte Frage, aber ich füge einige zusätzliche Informationen für jeden hinzu, der hier von Google landet

Beachten Sie, dass nach der Ausführung eines Jobs in TORQUE jede Anforderung zur Verlängerung der Wandzeit ignoriert wird, es sei denn, der Befehl qalter wird von einem TORQUE-Manager oder -Operator ausgeführt. Um die Pausenzeit eines laufenden Jobs zu verlängern, müssen Sie sich an einen Administrator wenden. Sie können die Wandzeit Ihrer eigenen laufenden Jobs verkürzen. Wenn Ihr Job nicht ausgeführt wird (in der Warteschlange oder in der Warteschlange), können Sie die Wandzeit mit qalter erhöhen.

Tal
quelle