壹佰网|ERP100 - 企业信息化知识门户

 找回密码
 注册

QQ登录

只需一步,快速开始

查看: 1988|回复: 0

Power7 虚拟化管理中的强大功能 - 分区的挂起和恢复

[复制链接]
发表于 2012/7/11 17:14:19 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。如果您注册时有任何问题请联系客服QQ: 83569622  。

您需要 登录 才可以下载或查看,没有帐号?注册

x
简介: 本文主要介绍了 Power7 虚拟化管理中的一个新功能,分区的挂起和恢复,首先是基本原理和概念的阐述,然后对系统状态转换进行了描述,最后给出了具体实施中的操作步骤。


概述
在用户日常的系统使用和维护中,经常面临以下两个问题:一,系统硬件升级时的宕机时间较长;二,系统资源无法均衡利用,造成资源浪费。针对以上问题,IBM Power7 系统提供了挂起和恢复功能,挂起是指 LPAR 处于待机 / 休眠的状态,它占用的资源可以被其他 LPAR 使用,而恢复意味着分区可以从休眠恢复到挂起时的状态,整个过程中 LPAR 的状态信息存放在存储设备的页交换空间里,因而它可以有效地减少宕机时间,合理分配和使用系统资源。本文详细介绍了挂起和恢复的基本原理、系统状态机转换、并图解介绍了系统挂起恢复的基本流程,希望能给系统实施人员和系统管理员的日常工作提供参考。
名词解释
RSDP: Reserved Storage Device Pool(存储设备池)
VIOS: 虚拟 IO 服务器
LPAR: Power 系统的逻辑分区
LPM: Logical Partition Mobile(逻辑分区迁移)


挂起和恢复的具体含义
在 IBM POWER7 系统中,VIOS 支持 AIX 或者 Linux LPAR 的挂起和恢复,当一个 LPAR 挂起的时候,其上运行的操作系统和应用都被挂起,整个 LPAR 的运行状态被保存下来。当恢复 LPAR 的时候,所有挂起时运行的进程都被复原。
一旦一个 LPAR 处于挂起状态,它占用的所有 CPU 和内存资源都可以被其他 LPAR 利用,与 VIOS 相关的虚拟适配器的配置信息暂时被移除,被保存在存储设备中,留做恢复时使用。这时 HMC 中该 LPAR 显示的状态为挂起,在挂起状态下,任何计划中或意外的断电都不会影响该 LPAR。


挂起和恢复功能给应用带来的益处

  • 均衡利用资源,可以按照应用系统的需求,更加合理地安排资源的使用,当资源紧张时,通过挂起部分 LPAR,释放出资源满足其他紧急的业务需求,待资源宽裕时,再恢复挂起的 LPAR。
  • 方便硬件的维护和升级,当需要升级时挂起系统,升级完毕,恢复系统即可。

  • 由于该处理方法只涉及一个 server 服务器,且只需 PowerVM 标准版,所以相比迁移(LPM)的方式要简单省时经济。
  • 对于应用的开启关闭需要较长时间的系统,传统的方式是通过关机进行系统维护,采用挂起和恢复功能,可以有效减少系统维护的宕机时间。


挂起和恢复中包含的基本概念
为方便读者理解挂起和恢复的功能,下面介绍两个基本概念:RSDP 和系统状态机转换,其中 RSDP( 保留存储池 ) 用于给 LPAR 分配存储空间,状态机转换主要是讨论在挂起和恢复中系统处于的运行状态。

  • RSDP 的含义 当 LPAR 处于挂起状态时,其状态信息存放在一个保留的存储设备中,这个存储设备是通过 HMC,在 RSDP( 保留存储池 ) 中进行分配的,其容量大约是该 LPAR 最大内存的 110%。RSDP 包含许多保留存储设备,也叫做换页空间,每一个要挂起的 LPAR 都必须拥有自己的换页空间。通常我们将一个 VIOS 分区与 RSDP 关联,提供换页服务,当然为了提供冗余路径,保证高可用的换页空间设备,我们也可以将另外一个 VIOS 也与 RSDP 关联起来。
    当系统满足挂起条件时,RSDP 可以在 HMC 中设置,既可以通过 HMC CLI, 也可以通过图形界面。当执行挂起操作时,HMC 从 RSDP 中分配存储空间给相应 LPAR,通常它会自动挑选一块没有被使用而且大小合适的空间用做存储 LPAR 挂起时的数据,当然必须保证 RSDP 的该部分存储在系统挂起时是可用的。
    举例说明 RSDP 中页空间的分配,在本实例中,采用实施中最典型的双 VIOS 分区,划分了 4 个 LPAR,RSDP 的设计既包含外部存储也包含内部存储,既有双路径连接也有单路径连接,基本覆盖了 RSDP 中涉及的所有情况。
    其中 LPAR1,LPAR2,LPAR3 使用 SAN 磁盘作为换页空间设备,LPAR4 使用本地磁盘作为换页空间设备,并关联在 VIOS 分区 2 上,两个 VIOS 分区如图所示和 SAN 连接,绿线代表换页空间设备映射给 VIOS 分区 1,蓝线代表换页空间设备映射给 VIOS 分区 2,其中换页空间设备 2(Paging space device2) 和换页空间设备 3(Paging space device3) 拥有双路径。


    图 1.RSDP 中换页空间的分配(查看大图
    image003.jpg

    在 PowerVM 的标准版中,我们可以在 RSDP 中管理换页空间,比如以下的操作:

    • 创建和删除 RSDP
    • 从 RSDP 中添加或删除 VIOS
    • 在 RSDP 中添加或删除换页空间设备
  • 挂起恢复中系统状态机转换 以下是 LPAR 在运行中基本的状态机转换,本文侧重于挂起恢复部分的介绍。


    图2.LPAR 状态机转换
    image005.gif

    • 挂起 LPAR 的状态信息存放在存储设备中,任何计划中或意外的断电都不会影响该 LPAR。
      在 HMC 界面里,挂起操作通常要经过以下流程:

      • 启动挂起操作。
      • 挂起操作的环境验证,包括挂起功能是否使能,RSDP 是否存在等。
      • 保存 HMC 数据,也就是 LPAR 的系统配置信息。
      • 保存 LPAR 的数据,也就是操作系统的运行状态信息。
      • 完成挂起操作。
    • 恢复 使 LPAR 恢复到挂起时的运行状态。
      在 HMC 界面里,恢复操作通常要经过以下流程:
    • 启动恢复操作。
      • 恢复操作的环境验证,系统硬件是否符合 LPAR 配置要求,RSDP 是否存在等。
      • 恢复 LPAR 配置。
      • 恢复 LPAR 的数据,也就是操作系统的运行状态。
      • 完成恢复操作。
    • 关闭 将 LPAR 由挂起状态置为停机,通常换页空间会被释放,所有虚拟适配器的配置信息都会保存起来,也包括一些操作系统运行信息,以保证 LPAR 以后可以被正常激活。
      如果是强制停机,部分运行时的配置、数据信息可能会丢失,使得 LPAR 处于不一致的系统状态,从而导致 LPAR 再次激活时出错,所以不推荐这种状态转换。
    • LPM LPAR 的迁移,分为动态迁移和静态迁移,具体参考 IBM 其他文档介绍。
    • 迁移
    将挂起的 LPAR 迁移到另外一台主机上,该技术基于 LPM,在迁移过程中,LPAR 的配置文件,操作系统运行时状态信息都会迁移到目标主机,从而可以在新的主机上被恢复。

挂起恢复的基本操作

  • 配置需求 为支持挂起 / 恢复功能,LPAR 需满足以下需求:

    • 软硬件最低版本
      • POWER 7 Firmware 7.2.0 SP1
      • HMC v7 r7.2.0
      • VIOS 2.2 0.11-FP24 SP01
      • AIX 7.1 TL0 SP2 or AIX 6.1 TL6 SP3

    • LPAR 配置要求
      • 用于存放 LPAR 状态的存储设备 (RSDP) 必须永久地与 LPAR 连接。
      • 确保 RSDP 中至少存在一个可用的 VIOS 活动分区
      • 该 LPAR 不能挂载物理的 IO 设备。
      • 该 LPAR 不能是全分区,IBM i 分区,VIOS 分区或者服务分区。
      • 该 LPAR 不能是一个 alternative error logging 分区 .
      • 该 LPAR 不能有 Barrier Synchronization Register (BSR)
      • 该 LPAR 不能有 huge memory pages
      • 当执行挂起或恢复操作时,系统监控必须关闭。
      • 该 LPAR 不能有基于逻辑卷的 rootvg 卷组或者包含任何外置的光学设备。
      • NPIV 必须包含两个 WWPNs, 并且在交换机中被划分到同一个 zone.
      • 挂起 LPAR 前,必须将 VIOS 中的虚拟光学库手动删除。
  • 创建 RSDP 要使用挂起和恢复功能,必须创建 RSDP,


    图 3.RSDP 的管理配置入口(查看大图
    image007.jpg

    • 创建支持挂起和恢复的分区
    • 验证分区是否支持挂起和恢复功能
    • 挂起分区

      图 4.启动 LPAR 的挂起操作
      image009.jpg
    • 恢复分区

      图 5.启动 LPAR 的恢复操作
      image011.jpg


结束语
挂起和恢复功能操作简单,实践中减少了系统维护过程中的宕机时间,使资源得到合理分配和利用,从而有效地简化了 IT 人员的系统维护工作,今后会在工程中得到广泛的应用



该贴已经同步到 纵横四海的微博
您需要登录后才可以回帖 登录 | 注册

本版积分规则

QQ|Archiver|小黑屋|手机版|壹佰网 ERP100 ( 京ICP备19053597号-2 )

Copyright © 2005-2012 北京海之大网络技术有限责任公司 服务器托管由互联互通
手机:13911575376
网站技术点击发送消息给对方83569622   广告&合作 点击发送消息给对方27675401   点击发送消息给对方634043306   咨询及人才点击发送消息给对方138011526

GMT+8, 2025/11/28 22:39 , Processed in 0.024869 second(s), 19 queries , File On.

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表