部署高可用NFS集群
NFS服务器挂载存储盘阵准备工作为两台作为NFS服务器的系统盘设置 raid1 , 并部署 centos7.9 系统。
设置主机名为 nfs01 和 nfs02 ,为节点规划ip地址 。
==================================== ====================================
ip规划 ip地址浮动ip 172.16.0.10/16nfs01管理&心跳网络 172.16.0.11/16nfs02管理&心跳网络 172.16.0.12/16
==================================== ====================================
编辑 nfs01 和 nfs02 节点的 /etc/hosts 文 ...
ibstat状态信息说明
简介通过 ibstat 命令查看IB HCA的状态。
输出格式例:
123456789101112131415161718# ibstatCA 'hfi1_0' CA type: Number of ports: 1 Firmware version: 1.27.0 Hardware version: 11 Node GUID: xxxxxxxxxxxxxxxxxx System image GUID: xxxxxxxxxxxxxxxxxx Port 1: State: Active Physical state: LinkUp Rate: 100 Base lid: 96 LMC: 0 SM lid: 1 Capability mask: xxxxxxxxxx Port GUID: xxxxxxxxxxxxxxxxxx Link layer: InfiniBand
Physical StatePhysical State (物理状态)指示线缆的状态,这个字段有两种值:
Polling轮询状态,从这张卡到另一张卡没有连接时会显示。
LinkUp ...
《恶魔之魂 重置版》白金流程推荐
前言《恶魔之魂 重置版》的具体流程攻略网上已经有很多了,本篇文章主要是分享一下我的白金流程路线推荐。
全魔法全奇迹的获取奖杯正常情况下需要三周目,但是可以依靠云存档来分别解锁,因此二周目中途就可以完成全奖杯。
一周目1-11-1没啥好说的,把两条近路全开好,记得留十几个火焰壶打BOSS。
击杀BOSS后在神殿自杀恢复灵魂状态。
1-21-2需要注意的是BOSS带有特殊击杀奖杯,需要在不击杀任何弓箭手的情况下击杀BOSS,如果觉得困难,可以等二周目再完成。
击杀BOSS后在神殿自杀恢复灵魂状态。
2-12-1开始会遇到几个胖官吏,固定会给官吏套的部件,之后的拯救魔女支线会用到。
击杀BOSS后在神殿自杀恢复灵魂状态。
2-2从篝火处左转是正常的流程线路,收集完本关的道具后,回到篝火处进行补给,往右走跳矿坑直接来到BOSS处。
击杀BOSS后在神殿自杀恢复灵魂状态。
2-3BOSS龙神有个特殊击杀奖杯,需要用天神之手完成击杀,由于天神之手需要16点信仰,如果不是一周目就决定走信仰流,建议还是不要浪费一周目的加点,等二周目再来完成该奖杯。
击杀BOSS后,传送回2-3篝火,世界此时变成纯白, ...
LDMS部署和使用
部署ldmsLight Weight Monitoring System
在客户端安装ldms编译安装ldms安装编译依赖库:
12# yum check-update; yum groupinstall -y 'Development Tools'; yum install -y git# yum install -y autoconf automake libtool make bison flex gettext-devel libevent-devel openssl-devel python3-devel python36-Cython
克隆最新版LDMS代码,使用 OVIS-4.3.4 版本:
1234# cd /usr/local/src# git clone https://github.com/ovis-hpc/ovis.git# cd ovis# git checkout OVIS-4.3.4
进入目录编译安装,设置安装目录为 /opt/ovis :
12345678# cd ovis# sh autogen.sh# mkdir build# ...
slurm调度系统管理员常用命令整理
节点状态管理显示节点、队列状态:
1sinfo
查看指定节点状态:
1sinfo -N | grep NODENAME
查看下线节点:
1sinfo -R
下线节点:
1scontrol update nodename=NODENAME state=down reason=MESSAGE
标记节点:
1scontrol update nodename=NODENAME state=drain reason=MESSAGE
节点恢复上线:
1scontrol update nodename=NODENAME state=resume
作业状态管理查看所有作业:
1squeue
查看指定用户作业:
1squeue -u USERNAME
查看指定节点上的作业:
1squeue -w NODENAME
查看指定作业详细信息:
1scontrol show jobid JOBID
更改作业排队权重:
1scontrol update jobid=JOBID Priority=NUM
更改作业运行时限:
1scontrol update jobid=JOBID TimeLi ...
