马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。如果您注册时有任何问题请联系客服QQ: 83569622 。
您需要 登录 才可以下载或查看,没有帐号?注册
x
简介: 本文主要介绍了 Power7 虚拟化管理中的一个新功能,分区的挂起和恢复,首先是基本原理和概念的阐述,然后对系统状态转换进行了描述,最后给出了具体实施中的操作步骤。
概述
在用户日常的系统使用和维护中,经常面临以下两个问题:一,系统硬件升级时的宕机时间较长;二,系统资源无法均衡利用,造成资源浪费。针对以上问题,IBM Power7 系统提供了挂起和恢复功能,挂起是指 LPAR 处于待机 / 休眠的状态,它占用的资源可以被其他 LPAR 使用,而恢复意味着分区可以从休眠恢复到挂起时的状态,整个过程中 LPAR 的状态信息存放在存储设备的页交换空间里,因而它可以有效地减少宕机时间,合理分配和使用系统资源。本文详细介绍了挂起和恢复的基本原理、系统状态机转换、并图解介绍了系统挂起恢复的基本流程,希望能给系统实施人员和系统管理员的日常工作提供参考。
名词解释
RSDP: Reserved Storage Device Pool(存储设备池)
VIOS: 虚拟 IO 服务器
LPAR: Power 系统的逻辑分区
LPM: Logical Partition Mobile(逻辑分区迁移)
挂起和恢复的具体含义
在 IBM POWER7 系统中,VIOS 支持 AIX 或者 Linux LPAR 的挂起和恢复,当一个 LPAR 挂起的时候,其上运行的操作系统和应用都被挂起,整个 LPAR 的运行状态被保存下来。当恢复 LPAR 的时候,所有挂起时运行的进程都被复原。
一旦一个 LPAR 处于挂起状态,它占用的所有 CPU 和内存资源都可以被其他 LPAR 利用,与 VIOS 相关的虚拟适配器的配置信息暂时被移除,被保存在存储设备中,留做恢复时使用。这时 HMC 中该 LPAR 显示的状态为挂起,在挂起状态下,任何计划中或意外的断电都不会影响该 LPAR。
挂起和恢复功能给应用带来的益处
- 均衡利用资源,可以按照应用系统的需求,更加合理地安排资源的使用,当资源紧张时,通过挂起部分 LPAR,释放出资源满足其他紧急的业务需求,待资源宽裕时,再恢复挂起的 LPAR。
- 方便硬件的维护和升级,当需要升级时挂起系统,升级完毕,恢复系统即可。
- 由于该处理方法只涉及一个 server 服务器,且只需 PowerVM 标准版,所以相比迁移(LPM)的方式要简单省时经济。
- 对于应用的开启关闭需要较长时间的系统,传统的方式是通过关机进行系统维护,采用挂起和恢复功能,可以有效减少系统维护的宕机时间。
挂起和恢复中包含的基本概念
为方便读者理解挂起和恢复的功能,下面介绍两个基本概念:RSDP 和系统状态机转换,其中 RSDP( 保留存储池 ) 用于给 LPAR 分配存储空间,状态机转换主要是讨论在挂起和恢复中系统处于的运行状态。
- RSDP 的含义 当 LPAR 处于挂起状态时,其状态信息存放在一个保留的存储设备中,这个存储设备是通过 HMC,在 RSDP( 保留存储池 ) 中进行分配的,其容量大约是该 LPAR 最大内存的 110%。RSDP 包含许多保留存储设备,也叫做换页空间,每一个要挂起的 LPAR 都必须拥有自己的换页空间。通常我们将一个 VIOS 分区与 RSDP 关联,提供换页服务,当然为了提供冗余路径,保证高可用的换页空间设备,我们也可以将另外一个 VIOS 也与 RSDP 关联起来。
当系统满足挂起条件时,RSDP 可以在 HMC 中设置,既可以通过 HMC CLI, 也可以通过图形界面。当执行挂起操作时,HMC 从 RSDP 中分配存储空间给相应 LPAR,通常它会自动挑选一块没有被使用而且大小合适的空间用做存储 LPAR 挂起时的数据,当然必须保证 RSDP 的该部分存储在系统挂起时是可用的。
举例说明 RSDP 中页空间的分配,在本实例中,采用实施中最典型的双 VIOS 分区,划分了 4 个 LPAR,RSDP 的设计既包含外部存储也包含内部存储,既有双路径连接也有单路径连接,基本覆盖了 RSDP 中涉及的所有情况。
其中 LPAR1,LPAR2,LPAR3 使用 SAN 磁盘作为换页空间设备,LPAR4 使用本地磁盘作为换页空间设备,并关联在 VIOS 分区 2 上,两个 VIOS 分区如图所示和 SAN 连接,绿线代表换页空间设备映射给 VIOS 分区 1,蓝线代表换页空间设备映射给 VIOS 分区 2,其中换页空间设备 2(Paging space device2) 和换页空间设备 3(Paging space device3) 拥有双路径。
图 1.RSDP 中换页空间的分配(查看大图)
在 PowerVM 的标准版中,我们可以在 RSDP 中管理换页空间,比如以下的操作:
- 创建和删除 RSDP
- 从 RSDP 中添加或删除 VIOS
- 在 RSDP 中添加或删除换页空间设备
- 挂起恢复中系统状态机转换 以下是 LPAR 在运行中基本的状态机转换,本文侧重于挂起恢复部分的介绍。
图2.LPAR 状态机转换
- 挂起 LPAR 的状态信息存放在存储设备中,任何计划中或意外的断电都不会影响该 LPAR。
在 HMC 界面里,挂起操作通常要经过以下流程:
- 启动挂起操作。
- 挂起操作的环境验证,包括挂起功能是否使能,RSDP 是否存在等。
- 保存 HMC 数据,也就是 LPAR 的系统配置信息。
- 保存 LPAR 的数据,也就是操作系统的运行状态信息。
- 完成挂起操作。
- 恢复 使 LPAR 恢复到挂起时的运行状态。
在 HMC 界面里,恢复操作通常要经过以下流程: - 启动恢复操作。
- 恢复操作的环境验证,系统硬件是否符合 LPAR 配置要求,RSDP 是否存在等。
- 恢复 LPAR 配置。
- 恢复 LPAR 的数据,也就是操作系统的运行状态。
- 完成恢复操作。
- 关闭 将 LPAR 由挂起状态置为停机,通常换页空间会被释放,所有虚拟适配器的配置信息都会保存起来,也包括一些操作系统运行信息,以保证 LPAR 以后可以被正常激活。
如果是强制停机,部分运行时的配置、数据信息可能会丢失,使得 LPAR 处于不一致的系统状态,从而导致 LPAR 再次激活时出错,所以不推荐这种状态转换。 - LPM LPAR 的迁移,分为动态迁移和静态迁移,具体参考 IBM 其他文档介绍。
- 迁移
将挂起的 LPAR 迁移到另外一台主机上,该技术基于 LPM,在迁移过程中,LPAR 的配置文件,操作系统运行时状态信息都会迁移到目标主机,从而可以在新的主机上被恢复。
挂起恢复的基本操作
- 配置需求 为支持挂起 / 恢复功能,LPAR 需满足以下需求:
- 软硬件最低版本
- POWER 7 Firmware 7.2.0 SP1
- HMC v7 r7.2.0
- VIOS 2.2 0.11-FP24 SP01
- AIX 7.1 TL0 SP2 or AIX 6.1 TL6 SP3
- LPAR 配置要求
- 用于存放 LPAR 状态的存储设备 (RSDP) 必须永久地与 LPAR 连接。
- 确保 RSDP 中至少存在一个可用的 VIOS 活动分区
- 该 LPAR 不能挂载物理的 IO 设备。
- 该 LPAR 不能是全分区,IBM i 分区,VIOS 分区或者服务分区。
- 该 LPAR 不能是一个 alternative error logging 分区 .
- 该 LPAR 不能有 Barrier Synchronization Register (BSR)
- 该 LPAR 不能有 huge memory pages
- 当执行挂起或恢复操作时,系统监控必须关闭。
- 该 LPAR 不能有基于逻辑卷的 rootvg 卷组或者包含任何外置的光学设备。
- NPIV 必须包含两个 WWPNs, 并且在交换机中被划分到同一个 zone.
- 挂起 LPAR 前,必须将 VIOS 中的虚拟光学库手动删除。
- 创建 RSDP 要使用挂起和恢复功能,必须创建 RSDP,
图 3.RSDP 的管理配置入口(查看大图)
- 创建支持挂起和恢复的分区
- 验证分区是否支持挂起和恢复功能
- 挂起分区
图 4.启动 LPAR 的挂起操作
- 恢复分区
图 5.启动 LPAR 的恢复操作
结束语
挂起和恢复功能操作简单,实践中减少了系统维护过程中的宕机时间,使资源得到合理分配和利用,从而有效地简化了 IT 人员的系统维护工作,今后会在工程中得到广泛的应用
该贴已经同步到 纵横四海的微博 |