Es ist ziemlich schmerzhaft zu entdecken, dass ein ein paar Tage langer Job aufgrund eines Fehlers bei der Festlegung des Wandzeitlimits vorzeitig beendet wird.
Gibt es eine Möglichkeit, dies für einen laufenden PBS- Job zu ändern ?
Dies ist systemspezifisch, aber Sie suchen nach dem qalter
Befehl.
qalter
könnte nur die Fristen verlängern, bevor der Job beginnt (was ich glaube, ich habe es in der Manpage gelesen).Wenden Sie sich über Ihren Cluster an die IT-Administratoren. Ich kenne Leute, die andere Probleme hatten, wie zum Beispiel Jobs, die nicht beginnen. Nachdem unser IT-Administrator es herausgefunden hatte, kümmerten sie sich darum.
quelle
Für faule Leute:
quelle
alte Frage, aber ich füge einige zusätzliche Informationen für jeden hinzu, der hier von Google landet
Beachten Sie, dass nach der Ausführung eines Jobs in TORQUE jede Anforderung zur Verlängerung der Wandzeit ignoriert wird, es sei denn, der Befehl qalter wird von einem TORQUE-Manager oder -Operator ausgeführt. Um die Pausenzeit eines laufenden Jobs zu verlängern, müssen Sie sich an einen Administrator wenden. Sie können die Wandzeit Ihrer eigenen laufenden Jobs verkürzen. Wenn Ihr Job nicht ausgeführt wird (in der Warteschlange oder in der Warteschlange), können Sie die Wandzeit mit qalter erhöhen.
quelle