Ist es möglich, über qsub übermittelte Jobs anzuhalten?

10

Ich führe meine Jobs in einem kleinen Cluster aus. Ich habe sie über eingereicht qsub. Jetzt brauchen meine Labkameraden dringend Ressourcen als ich, also muss ich entweder meine Jobs töten oder sie pausieren, wenn möglich.

Gibt es eine Möglichkeit, meine Jobs anzuhalten und die CPU, den RAM usw. freizugeben?

Ich bin ein normaler Benutzer (keine Root-Rechte).

Sibbs Glücksspiel
quelle
1
Sie können Ihre noch nicht ausgeführten Jobs mit zurückhalten qhold, dies wirkt sich jedoch nicht auf bereits ausgeführte Jobs aus. Es scheint, dass qmodlaufende Jobs angehalten werden können, aber Root- oder Manager-Berechtigungen erforderlich sind.
Jofel
Angenommen, Sie haben einen MOAB-Cluster: Sie können Ihren Job anhalten
Ott Toomet

Antworten:

6

Wenn die Jobs noch nicht gestartet wurden, können Sie sie mit auf Eis legen qhold. Verwenden Sie qrlszum Neustart.

qhold <job ID>
qrls <job ID>

Wenn sie bereits ausgeführt werden, können Sie sie qsigzum Anhalten und Fortsetzen von Jobs verwenden (möglicherweise benötigen Sie zusätzliche Berechtigungen, fragen Sie Ihren Administrator, ob dies der Fall ist):

qsig -s suspend <job ID>
qsig -s resume <job ID>

Sobald Sie Ihren Job wieder aufgenommen haben, müssen Sie ihn möglicherweise zum Ausführen zwingen qrun

qrun <job ID>

Getestet auf einem SLES 11 SP4-System mit PBSPro 13.0.2.153173, aber ich bin zuversichtlich, dass es mit anderen POSIX-kompatiblen Batch-Jobübermittlungssystemen funktionieren sollte.

Calimo
quelle