Nahajate se tukaj

Nadzornik računskih virov - SLURM

Za večopravilnost in razporejanje računskih virov glede na predpisano politiko poslov skrbi sistemska programska oprema SLURM (Simple Linux Utility for Resource Managment). Vzporedni posli se običajno popisujejo v skriptah ukazne školjke. Običajno je, da se celoten nadzor opravlja iz ukazne vrstice. Najbolj pogosti ukazi so:

  1. sbatch ime-posla.slurm
  2. squeue
  3. scancel ime-ali-številka-posla

S prvim ukazom zaženemo program s predpisanimi parametri v skripti. Če poganjamo več istih programov z različnimi vhodnimi podatki, je potrebno zagotoviti, da se rezultati pišejo v ločene datoteke.
Drugi ukaz prikazuje trenutno stanje čakalne vrste poslov uporabnika. Kdaj se požene kakšen posel je odvisno od stanja vseh poslov na superračunalniku. Tretji ukaz ustavi delujoči posel in ga izbriše iz vrste. Poleg navedenih najbolj uporabljanih ukazov obstajajo še ukazi, s katerimi lahko podrobneje spremljano stanje SLURM in uporabniških računov.

Potek izvajanja poslov

  1. Vzpostavitev posla - Z nadzornega vozlišča (lahko tudi od drugje) z ukazom bsub  pošljemo zahtevo za izvajanje posla
  2. Uvrstitev v čakalno vrsto - SLURM na nadzornem vozlišču preuči možnosti za izvajanje posla in ga požene takoj, ko je to mogoče
  3. Razvrstitev posla - Nadzorno vozlišče pošlje posel na prosta računska vozlišča
  4. Poganjanje posla na računskih vozliščih
  5. Vračanje rezultatov  v obliki izpisa programa

Uporaba SLURM-a

Poženi ukaz na X vozliščih z Y jedri:

srun -N X -n Y <i>ukaz</i>

Vstavi v čakalno vrsto skripto:

sbatch <i>skripta.sh</i>

Zaženi interaktivno sejo:

srun --pty bash -i

Preveri stanje nedokončanih poslov:

squeue

Povzemi zasedenost po čakalnih vrstah:

sinfo

Preveri zgodovino današnjih jobov

sacct
Preveri zgodovino vseh jobov: od datuma naprej:

sacct --starttime 2019-05-01 --format=User,JobID,Jobname,partition,state,time,start,end,elapsed,MaxRSS,MaxVMSize,ReqMem,nnodes,ncpus,nodelist


Več primerov uporabe na voljo na https://slurm.schedmd.com/quickstart.html

Pregled porabe vozlišč

Porabo lahko preverite na https://grafana.hpc.fs.uni-lj.si/ na pogledu "Telegraf metrics". Pod "server" izberete željena vozlišča.

Skripte