布恩网站删除,成都电子网站建设,制作什么网站做毕业设计,wordpress修改登陆salloc 申请计算节点#xff0c;然后登录到申请到的计算节点上运行指令#xff1b; salloc的参数与sbatch相同#xff0c;该部分先介绍一个简单的使用案例#xff1b;随后介绍一个GPU的使用案例#xff1b;最后介绍一个跨节点使用案例#xff1b; 首先是一个简单的例子然后登录到申请到的计算节点上运行指令 salloc的参数与sbatch相同该部分先介绍一个简单的使用案例随后介绍一个GPU的使用案例最后介绍一个跨节点使用案例 首先是一个简单的例子 申请一个节点6个核心并跳转到该节点上运行程序 2. Slurm 作业调度系统使用指南
4.1 参数说明以下所有参数在 srun, sbatch, salloc 中均可以使用。更多参数见srun --help, sbatch --help, salloc --help。-c, --cpu-per-taskNCPUs #指定每个进程使用核数不指定默认为1
-e, --errorerror_filename #指定错误文件输出
-J, --job-nameJOBNAME #指定作业名称
--mail-typeEND/FAIL/ALL #邮件提醒可选:END,FAIL,ALL
--mail-usermail_address #通知邮箱地址
-n, --ntaskNTASKs #指定总进程数不使用cpus-per-task可理解为进程数即为核数
--ntasks-per-nodeN #指定每个节点进程数/核数使用-n参数后变为每个节点最多运行的进程数
-N, --nodesN #指定节点数量
-o, --outputout_filename #指定输出文件输出
-p, --partiondebug #指定分区
-t, --timedd-hh:mm:ss #作业最大运行时间
-w, --nodelistnode[1,2] #指定优先使用节点不可与避免节点冲突
-x, --excludenode[3,5-6] #指定避免使用节点不可与优先节点冲突
--mem-per-cpuMB #指定计算cpu最大占用内存大小4.2 交互模式 Srun 交互式作业提交提交命令后等待作业执行完成之后返回命令行窗口。 Demo of srun srun -J JOBNAME -p debug -N 2 -c 1 -n 32 --ntasks-per-node16 -w node[3,4] -x node[1,5-6] --timedd-hh:mm:ss --outputfile_name --errorfile_name --mail-useraddress --mail-typeALL mpirun -n 64 ./iPic3D ./inputfile/test.inp同 Demo of sbatch 4.3 批处理模式 Sbatch 批处理作业是指用户编写作业脚本指定资源需求约束提交后台执行作业。提交批处理作业的命令为 sbatch用户提交命令即返回命令行窗口但此时作业在进入调度状态在资源满足要求时分配完计算结点之后系统将在所分配的第一个计算结点而不是登录结点上加载执行用户的作业脚本。批处理作业的脚本为一个文本文件脚本第一行以 “#!” 字符开头并制定脚本文件的解释程序如 shbash。 运行 sbatch filename 来提交任务计算开始后工作目录中会生成以 slurm 开头的.out 文件为输出文件不指定输出的话。 Demo of sbatch 保存在运行程序目录下即可文件名随意可以无后缀内容文本格式即可作业提交命令sbatch filename #!/bin/bash %指定运行shell
#提交单个作业
#SBATCH --job-nameJOBNAME %指定作业名称
#SBATCH --partitiondebug %指定分区
#SBATCH --nodes2 %指定节点数量
#SBATCH --cpus-per-task1 %指定每个进程使用核数不指定默认为1
#SBATCH -n 32 %指定总进程数不使用cpus-per-task可理解为进程数即为核数
#SBATCH --ntasks-per-node16 %指定每个节点进程数/核数,使用-n参数优先级更高变为每个节点最多运行的任务数
#SBATCH --nodelistnode[3,4] %指定优先使用节点
#SBATCH --excludenode[1,5-6] %指定避免使用节点
#SBATCH --timedd-hh:mm:ss %作业最大运行时长参考格式填写
#SBATCH --outputfile_name %指定输出文件输出
#SBATCH --errorfile_name %指定错误文件输出
#SBATCH --mail-typeALL %邮件提醒,可选:END,FAIL,ALL
#SBATCH --mail-useraddress %通知邮箱地址source /public/home/user/.bashrc #导入环境变量文件mpirun -n 32 ./iPic3D ./inputfiles/test.inp #运行命令同 Demo of srun 4.4 分配模式 Salloc 结点资源抢占命令。该命令支持用户在提交作业前抢占所需计算资源此时开始计算所用机时。需请求资源然后在获取节点后登录到计算节点。目前作者使用设备可直接登录计算节点暂未使用。 sacct 命令也未启用暂无说明有需要可在文末参考网页查看。 5. Scontrol 5.1 信息查看 scontrol show job JOBID #查看作业的详细信息
scontrol show node #查看所有节点详细信息
scontrol show node node-name #查看指定节点详细信息
scontrol show node | grep CPU #查看各节点cpu状态
scontrol show node node-name | grep CPU #查看指定节点cpu状态5.2 更新作业 在任务开始前却发现作业的属性写错了例如提交错了分区修改名字取消了重新排队似乎很不划算。如果作业恰好 没在运行我们是可以通过 scontrol 命令来更新作业的属性 scontrol update jobidJOBID ... #...为下面参数
reqnodelistnodes
reqcorescount
namename
nodelistnodes
excnodelistnodes
numcpusmin_count-max_count
numnodesmin_count-max_count
numtaskscount
starttimeyyyy-mm-dd
partitionname
timelimitd-h:m:s
mincpusnodecount
minmemorycpumegabytes
minmemorynodemegabytes作业调度系统 · 北京大学高性能计算使用指南 SLURM 使用参考 Slurm 作业调度系统 — 上海交大超算平台用户手册 文档 SLURM使用基础教程 - 曙光先进计算 Slurm User Guide for Great Lakes | ITS Advanced Research Computing