SPARC® Enterprise
M8000/M9000 服务器
概述指南
手册代码 C120-E324-03ZH
文件号码 820-1454-10
2007 年 4 月,修订版 A
目录
iii
iv
SPARC Enterprise M8000/M9000 服务器概述指南 • 2007 年 4 月
目录
v
vi
SPARC Enterprise M8000/M9000 服务器概述指南 • 2007 年 4 月
图
SPARC Enterprise M8000 服务器 1-2
SPARC Enterprise M9000 服务器 (仅基本机柜) 1-3
SPARC Enterprise M9000 服务器 (带有扩充机柜) 1-4
M8000 和电源机柜正视图 1-10
M8000 和电源机柜后视图 1-11
M9000 (仅基本机柜)和电源机柜正视图 1-12
M9000 (仅基本机柜)和电源机柜后视图 1-13
M9000 (带有扩充机柜)和电源机柜正视图 1-14
M9000 (带有扩充机柜)和电源机柜后视图 1-15
操作面板 1-16
外部 I/O 扩展单元 1-24
主要组件连接 2-3
分区划分类型 2-6
域配置 2-8
vii
viii
SPARC Enterprise M8000/M9000 服务器概述指南 • 2007 年 4 月
x
SPARC Enterprise M8000/M9000 服务器概述指南 • 2007 年 4 月
词汇表和索引
■
阐释了本手册中所使用的术语。
■
给出了关键词和相应的参考页码,以便读者在需要的时候可以方便地在本手册中
搜索条目。
SPARC Enterprise M8000/M9000 服务器
的文档
下列手册供参考。
书名
手册代码
C120-H014-01ZH
C120-H016-01ZH
C120-E323-01ZH
C120-E324-01ZH
C120-E391
《SPARC Enterprise M8000/M9000 服务器场地规划指南》
《SPARC Enterprise 设备机架装配指南》
《SPARC Enterprise M8000/M9000 服务器入门指南》
《SPARC Enterprise M8000/M9000 服务器概述指南》
《Important Safety Information for Hardware Systems》
C120-E326
《SPARC Enterprise M8000/M9000 Servers Safety and Compliance
Guide》
C120-E327-01XA
C120-E328-01ZH
C120-E330
《SPARC Enterprise M8000/M9000 服务器拆箱指南》
《SPARC Enterprise M8000/M9000 服务器安装指南》
《SPARC Enterprise M8000/M9000 Servers Service Manual》
《外部 I/O 扩展单元安装和服务手册》
C120-E329-01ZH
C120-E361
《SPARC Enterprise M4000/M5000/M8000/M9000 Servers RCI Build
Procedure》
C120-E331
《SPARC Enterprise M4000/M5000/M8000/M9000 Servers
Administration Guide》
《SPARC Enterprise M4000/M5000/M8000/M9000 Servers XSCF User’s C120-E332
Guide》
C120-E333
《SPARC Enterprise M4000/M5000/M8000/M9000 Servers XSCF
Reference Manual》
xii
SPARC Enterprise M8000/M9000 服务器概述指南 • 2007 年 4 月
书名
手册代码
《SPARC Enterprise M4000/M5000/M8000/M9000 Servers Dynamic
C120-E335
Reconfiguration (DR) User’s Guide》
《SPARC Enterprise M4000/M5000/M8000/M9000 Servers Capacity on C120-E336
Demand (COD) User’s Guide》
《SPARC Enterprise M4000/M5000/M8000/M9000 Servers RCI User’s
C120-E360
Guide》
C120-E325-01ZH
《SPARC Enterprise M8000/M9000 服务器产品说明》
1. Web 上的手册
所有 SPARC Enterprise 系列手册的最新版本都可以在下列 Web 站点获取。您可以
成批下载这些最新的手册。
全球性站点
日本站点
注 – 产品说明只能从 Web 站点获取。请查看与您的产品相关的最新更新版本。
2. 文档 CD
对于文档 CD,请与您当地的销售代表联系。
■
SPARC Enterprise M8000/M9000 服务器的文档 CD (C120-E364)
3. 在增强版辅助工具 x.x CD-ROM 光盘中所包含的手册
远程维护服务
■
书名
手册代码
C112-B067
《Enhanced Support Facility User's Guide for REMCS》
4. 系统中所提供的 XSCF 的手册页
注 – 可以通过 XSCF shell 参考该手册页,其中提供的内容与 《SPARC Enterprise
M4000/M5000/M8000/M9000 Servers XSCF Reference Manual》中的内容相同。
前言
xiii
5. 与 Solaris 操作系统相关的手册
6. 关于使用 RCI 函数的信息
本手册中并不包含对 RCI 编译步骤的说明。有关使用 RCI 函数的信息,请参阅 Web
站点中所提供的 《SPARC Enterprise M4000/M5000/M8000/M9000 Servers RCI
Build Procedure》以及 《SPARC Enterprise M4000/M5000/M8000/M9000
Servers RCI User’s Guide》。
文本格式约定
本手册采用下列字体和符号来表示特别类型的信息。
字体/符号
含义
示例
AaBbCc123
# ls -l<Return>
这是您键入的内容,当和计算机在
屏幕上的回显相对比时
AaBbCc123
# ls -l<Return>
命令、文件或者目录的名字;屏幕
上的计算机回显
斜体
指示参考手册的名字
请参见 《XSCF User's Guide》。
" "
指示章节、段落、条目、按钮、
菜单的名字
请参见第 2 章,“准备进行安装”。
提示符
在本手册中使用了下列提示符。
Shell
提示符
XSCF
XSCF>
C shell
machine-name%
machine-name#
C shell (超级用户)
Bourne shell 和 Korn shell
$
#
Bourne shell 和 Korn shell
(超级用户)
OpenBoot PROM
ok
xiv
SPARC Enterprise M8000/M9000 服务器概述指南 • 2007 年 4 月
命令行界面 (Command Line Interface,
CLI) 的语法
命令的语法如下:
■
■
■
■
■
需要输入一个数值的变量必须包含在 < > 中;
单个可选元素必须包含在 [ ] 中;
对于一个可选的关键字的一组选项必须包含在 [ ] 中,并以 | 分开;
对于一个必选的关键字的一组选项必须包含在 {} 中,并以 | 分开;
命令的语法显示在一个框中。
示例:
XSCF> showuser -a
使用本产品时对环境的需求
本产品为计算机,应在计算机房中使用。
用于告警消息的约定
本手册采用下列约定来显示告警消息,目的是为了防止用户或旁人受到伤害,或者财物
被损坏,也以此显示对用户有用的重要消息。
警告:
这指示的是这样一种冒险的情形 - 如果用户执行操作不当,可能导致人员的死亡或者重
伤 (潜在的危险)。
警示:
这指示的是这样一种冒险的情形 - 如果用户执行操作不当,可能导致人员受到轻微或者
中度的伤害。这个信号也表示如果用户执行操作不当,可能会损坏本产品或其他财物。
重要:
这指示的是可以帮助用户更有效地使用本产品的信息。
前言
xv
正文中的告警消息
在正文中的告警消息包含一个指示告警级别的信号,后面紧跟着一条对告警的声明。告
警消息是用于把它们和普通的正文区别出来。同时,在告警声明的前面和后面都将保留
一个空行。
警告:
对于富士通提供的本产品和其他可选配的产品,下列任务必须仅由获得了授权的维护人
员来执行。
用户不可以执行这些任务。对这些任务的不当操作可能会造成触电、受伤,或者火灾。
■
■
■
■
■
安装和重新安装所有的组件
移除前面、后面和侧面的封盖
安装/卸除可选配的内部设备
连接或者拔下外部的接口电缆
维护 (维修、定期的诊断和维护)
关于安全的注意事项
重要告警消息
本手册中给出了下列重要的告警信号:
警示 – 这个 “警告”信号指示的是这样一种危险的情形 - 如果用户执行操作不当,可
能导致死亡或重伤。
任务
警告
正常操作
触电,火灾
请不要损坏、折断或者改造供电电缆。电缆的损坏可能会导致触电或火灾。
xvi
SPARC Enterprise M8000/M9000 服务器概述指南 • 2007 年 4 月
警示 – 这个 “警示”信号指示的是这样一种冒险的情形 - 如果用户执行操作不当,可
能导致人员受到轻微或者中度的伤害。这个信号也表示如果用户执行操作不当,可能会
损坏本产品或其他财物。
任务
警告
正常操作
设备的损坏
在安装主机时,请确认符合下述防范措施。否则,设备可能会被损坏。
●
●
●
请不要挡住通风口。
请避免把设备安装在暴露于阳光直射下的地方,或者靠近变得极热的设备。
请避免把设备安装在布满灰尘的地方,或者直接暴露于腐蚀性气体或含盐
分的空气的地方。
●
●
●
请避免把设备安装在遭受强烈震动的地方。同时,请把设备安装在一个水
平面上,以使它比较稳当。
接地的线缆必须是三类线或更高级别的线。把它连接到另一个地线上来实
现共地的话,可能会导致故障。请确认地线使用了单独的接地路径。
请不要使电缆从任何设备下方通过。同时,请防止电缆被紧绷。当电源正
在供电给某个设备时,决不要将电源电缆从设备上拔下。
●
●
请不要在主机顶上放置任何物品。请不要把主机当作一个工作台。
请不要让设备暴露于环境温度的快速变化中,譬如在冬天运输时快速的升
温。在环境温度快速升高时,将导致设备内的潮气液化。仅当其温度和环
境温度的差别可以忽略的时候才能使用该设备。
●
●
请避免将设备安装在复印机、空调机或者焊接机附近,它们会产生较大噪声。
在安装现场,请采取防范措施以尽量减少静电。请注意在一些地毯上很容
易产生静电,并导致设备故障。
●
●
请确认在运转期间,电源的电压和频率均和设备上的额定数值相匹配。
请不要把任何物品插入设备的开口处。设备内部的组件具有较高的电压。
导电的外来物品 (譬如金属物体),在插入设备之后,可能会导致组件之
间的短路,从而造成火灾、触电或者设备损坏。
●
要对设备进行维护,请联系您的授权服务人员。
正常操作
数据的破坏
在关闭电源之前,请确认下面所列的项目。否则,数据可能会被破坏。
●
●
●
所有的应用程序都完成了处理;
没有使用者在使用该设备;
当关闭主机时,操作面板上的电源指示灯会熄灭。在关闭主电源 (不间断
电源 [UPS]、电力配置盒,以及主电力开关等)之前,请确保电源指示灯
已经熄灭。
如果必要的话,在关闭系统电源之前,请备份您的文件。
数据的破坏
请不要强制性地终止一个正在运行的域。否则,数据可能会被破坏。
数据的破坏
当电源正在供电时,请不要把电源线从交流电源输入端断开。否则,存放在
硬盘单元上的数据可能会被破坏。
前言
xvii
■
SPARC Enterprise M9000 服务器
SPARC Enterprise M9000 服务器 (正视图)
SPARC Enterprise M9000 服务器 (后视图)
前言
xix
警示 – 对于富士通提供的本产品和其他可选配的产品,下列任务必须仅由合格的服务
工程师来执行。用户不可以执行这些任务。对这些任务的不当操作可能会导致故障。
■
■
打开交付给用户的可选配的适配器和诸如此类的包裹
插入或者拔下外部的接口卡
改造/改建
警示 – 对于本产品及其组件的任何改造和/或重利用只可以由合格的服务工程师来执
行,而在任何情形下都不可以由用户来完成。
否则,可能导致触电、受伤或者火灾。
激光束的发射 (不可见)
警示 – 主机和高速光互连机柜包含了产生不可见激光辐射的模块。
激光束是在设备运行的时候产生的,即使光缆被断开或者封盖被移除也不例外。
请不要直视或者通过光学设备去看任何发光部件 (譬如放大镜、显微镜)。
富士通欢迎您的意见
的 “读者意见表”来递交意见。
前言
xxi
FOLD AND TAPE
NO POSTAGE
NECESSARY
IF MAILED
IN THE
UNITED STATES
BUSINESS REPLY MAIL
FIRST-CLASS MAIL PERMIT NO 741 SUNNYVALE CA
POSTAGE WILL BE PAID BY ADDRESSEE
FUJITSU COMPUTER SYSTEMS
AT TENTION ENGINEERING OPS M/S 249
1250 EAST ARQUES AVENUE
P O BOX 3470
SUNNYVALE CA 94088-3470
FOLD AND TAPE
前言
xxiii
xxiv
SPARC Enterprise M8000/M9000 服务器概述指南 • 2007 年 4 月
第1章
系统概述
本章对 SPARC® Enterprise M8000/M9000 服务器的特性、规格和配置进行了概述。
■
■
■
■
■
■
1.1
产品概述
SPARC Enterprise M8000/M9000 服务器是采用对称多处理 (symmetric multi-processing,
SMP) 体系结构开发的 UNIX 服务器。这些系统中的每个系统都兼收并蓄了巨型机技术
以便实现高可靠性,同时吸收了经过日积月累获得的相关技术诀窍,兼具了超级计算机
的高速技术和 UNIX 服务器开发的开放性。
如果在运行过程中发生了问题,则可以修正或隔离导致问题的错误,而无需停止系统。
此特性可在许多情况下最大限度地减少问题,从而提高了作业的连续性。
每个 SPARC Enterprise M8000/M9000 服务器都包含一个或多个 SPARC64 VI CPU。
它们可像多个服务器一样运行,允许灵活地使用资源 (包括更有效地执行作业操作)。
每个服务器由内含各种已安装组件的机柜、前门、后门和侧盖等服务器结构部分组成。
操作面板安装在前门,并且总能方便地接近它。处理和存储为前门和操作面板提供的专
用密钥时请特别小心。
1-1
SPARC Enterprise M9000 服务器 (带有扩充机柜)外观
扩充机柜是一个连接到 M9000 (仅针对基本机柜类型)的 M9000 选件。
图 1-3
SPARC Enterprise M9000 服务器 (带有扩充机柜)
SPARC Enterprise M8000/M9000 服务器具有以下特性:
■
多内核 SPARC64 VI 千兆赫处理器
这些处理器可提供出色的性能,这得益于其高可伸缩性(最多可扩充到 64 个双内核
CPU 模块)以及所采用的技术 (允许进行高速运算操作和数据传输)。
随着速度更快、性能更高的 CPU 模块逐渐可供使用,您可将它们添加到现有已安装
的 CPU 模块或使用它们替换现有已安装的 CPU 模块,以进一步提高性能。
该系统采用对称多处理 (symmetric multiple-processing, SMP),所以无论每个 CPU
的安装位置如何,它们都可以访问系统内存的任何部分。添加更多 CPU 不会影响对
任何已安装 CPU 的内存访问。
1-4
SPARC Enterprise M8000/M9000 服务器概述指南 • 2007 年 4 月
■
■
高速交叉开关型系统总线
高速交叉开关型系统总线可提供高速宽带数据传输。
ECC 内存
ECC 功能可保护所有系统总线和内存中的数据,所以数据中的任何错误都会被自动
修正。除了 ECC 内存外,还支持 Chipkill 内存保护。
■
■
将 PCIe 挂载为 I/O 总线
PCIe 具有最大总线宽度 (八个通道),用于 I/O 设备的互连总线。
可选的外部 I/O 扩展单元允许在系统中扩展 I/O 插槽
通过连接一个外部 I/O 扩展单元可向服务器中添加更多 PCIe 和 PCI-X 插槽。
外部 I/O 扩展单元通过电缆连接至插入到 I/O 单元 PCIe 插槽中的链路卡。
可冗余配置主要组件、电源单元和风扇单元
■
可对主要组件 (如电源单元、风扇单元、硬盘单元和 PCI 卡)采取冗余配置。实现
冗余配置后,即使作为系统一部分的某一个单元发生故障,系统也可在不发生中断
的情况下继续运行。
■
主要组件、电源单元和风扇单元支持活动更换/添加
支持在系统运行期间对主要组件 (如电源单元、风扇单元、硬盘单元、系统控制设
备 (板)、系统板和 PCI 卡)进行组件更换和添加,但有一些例外。
可采用动态重新配置 (Dynamic reconfiguration, DR) 来活动更换和添加用于配置系
统板的 CMU 和 IOU。
利用 PCI 热插拔 (PCI hot-plug, PHP) 功能,可以在系统正在运行时更换和添加 PCI 卡。
■
发生故障后自动重新引导
如果发生故障,会自动将有故障的组件从系统中隔离,并重新引导系统。如果在配
置 CPU 的高速缓存内存中频繁地发生 1 位错误,则可动态地隔离有故障的内存,而
无需重新引导 Solaris 操作系统。通过这种适度的降级功能,可在不发生中断的情况
下继续对其他资源进行操作,而且,还可在发生故障时提供高容错性。
■
扩展系统控制设备 (eXtended System Control Facility, XSCF)
SPARC Enterprise M8000/M9000 服务器使用名为扩展系统控制设备 (eXtended
System Control Facility, XSCF) 的服务处理器,该处理器监视硬件状态的异常情况,
域的运行状态和系统状态 (如温度、电源和风扇运行情况)。
您可以配置系统,使其在检测到错误时有选择地降级有故障的组件以便进行操作。
支持调度,以便根据指定的操作调度启用对 SPARC Enterprise 系统的自动加电和断电。
可通过网络从 XSCF 控制每个域的控制台。
基于浏览器的用户界面 (browser-based user interface, BUI) 和命令行界面
(command line interface, CLI) 为进行系统配置更改和状态监视等操作提供了方便。
第 1 章 系统概述
1-5
注 – 要进行控制台控制,需要使用控制台显示终端。请在安装前准备控制台显示终端。
下面列出了可用作终端的设备。
■
PC
工作站
ASCII 终端
■
■
■
终端服务器 (或者连接到终端服务器的触控面板)
注 – 有关控制台连接方法的信息,请参见 《SPARC Enterprise M8000/M9000 服务器
安装指南》。
■
分区功能
一个高端服务器可划分为多个区域 (或域),以实现更有效的可伸缩性。每个域与
XSCF 联合管理资源。根据域的预期用途,域可以由优化资源组成,从而实现更有效
的系统配置。
利用动态重新配置 (Dynamic Reconfiguration, DR),可以在不停止域中的处理的情
况下添加、删除和重定位域的资源。这样,即使在作业负荷突然增加或更换有故障
的组件时,也可在不停止作业的情况下动态重新配置资源。
有关域功能的详细信息,请参见 《SPARC Enterprise
M4000/M5000/M8000/M9000 Servers Administration Guide》。
有关 DR 功能的详细信息,请参见 《SPARC Enterprise
M4000/M5000/M8000/M9000 Servers Dynamic Reconfiguration (DR) User’s
Guide》。
■
■
支持 SolarisTM 操作系统 (Solaris 10 或更高版本)。
利用系统添加的错误预测和自恢复功能 (预测性自我修复)以及增强的处理权限管
理和网络功能, Solaris 操作系统为性能、效率、可用性和安全性设置了新标准。
即需即用 (Capacity on Demand, CoD)
支持即需即用 (Capacity on Demand, CoD),即允许根据作业负荷的增加即时增加
CPU 的容量。一旦购买了相应数量的 CPU 许可证,便可立即使用事先安装的备用
CPU,从而可适应这种增加处理能力的需要。
有关详细信息,请参见《SPARC Enterprise M4000/M5000/M8000/M9000 Servers
Administration Guide》。
1.2
系统规格
本节列出了两种高端服务器的规格、显示了其外观,并对操作面板进行了概述。
1-6
SPARC Enterprise M8000/M9000 服务器概述指南 • 2007 年 4 月
1.2.1
主单元规格
表 1-1
主单元规格
M9000
M8000
项目
仅基本机柜
基本机柜 + 扩充机柜
3
类型
落地式
CPU
SPARC64 VI
类型
CPU 数量
32 个内核 (最多 16 个
64 个内核 (最多 32 个
128 个内核 (最多 64 个
CPU 模块)
CPU 模块)
CPU 模块)
4
4
4
1 TB
2 TB
4 TB
主存储
(内存模块)
最大内存大小
错误检查功能 错误检查和修正 (Error Checking and Correction, ECC)
内置到 SPARC Enterprise 中
的 PCI 插槽 (PCI Express)
最多 32 个插槽
最多 64 个插槽
最多 128 个插槽
1
外部 I/O 扩展单元 (最大连
接数)
8 个单元 (16 个船)
16 个单元 (32 个船)
16 个单元 (32 个船)
最大插槽数 (安装 I/O 船时) 112 个插槽
224 个插槽
288 个插槽
64 个插槽
2 个驱动器
2
硬盘驱动器
DVD-ROM 驱动器
磁带机
16 个插槽
32 个插槽
1 个驱动器
可安装 1 个磁带机 (选件)
可安装 2 个磁带机
(选件)
风扇单元
4 个单元 (类型 A)
16 个单元 (类型 A)
32 个单元 (类型 A)
8 个单元 (类型 B)
电源单元 (所安装单元的最大 9 个单元
数量)(单相,一个系统)
15 个单元
30 个单元
冗余配置
电源单元、风扇单元、 XSCF、电源系统 (双供电选件)和时钟供给系统
可热交换的组件
CPU/内存板单元、I/O 单元、系统控制设备、磁盘、PCI 卡、DVD-ROM 驱动
器、磁带机、外部 I/O 扩展单元
系统控制接口
LAN、串行、不间断电源 (uninterruptible power supply, UPS) 接口、远程机
柜接口 (remote cabinet interface, RCI) 和 USB
5
16
24
24
域数量
6
操作环境
Solaris 操作系统
1 最多八个 PCIe 总线通道连接到每个插槽。
2 使用硬盘驱动器时需要使用内置的 IOU 板载设备卡 A (IOU Onboard Device Card_A, IOUA)。
3 SPARC Enterprise M8000 服务器机柜的上半部分具有 12 个机架单元 (rack unit, RU) 的空间。
第 1 章 系统概述
1-7
4 这是安装 8 GB 双列直插式内存模块 (dual inline memory module, DIMM) 时的最大容量。
5 这种接口仅供经过授权的服务人员进行维护时使用。它不支持一般用途的 USB 设备。
6 有关操作系统的最新信息,请访问我们的 Web 站点,或与您的销售代表联系。有关最新的 URL 信息,请参见
“前言”中提到的参考手册中描述的有关消息的 Web 站点信息。
1.2.2
安装规格
表 1-2
安装规格
M9000
仅基本机柜
850
M8000
750
项目
基本机柜 + 扩充机柜
1674
1260
1800
1880
外围尺寸
宽度 [mm]
1260
1800
700
1260
深度 [mm]
1800
高度 [mm]
940
重量 [kg]
1.2.3
环境规格
表 1-3
环境规格
1
温度 [°C (°F)]
湿度 [%RH]
非工作期间的
要求
工作期间的
要求
非工作期间
的要求
服务器名称
工作期间的要求
SPARC Enterprise
5 至 32 (41 至 89.6),在安装海拔高度范围为海 0 至 50
20 至 80
8 至 80
M8000 服务器
平面以上 0 至不足 1,500 米 (4921 英尺)时
(32 至 122)
5 至 30 (41 至 86),在安装海拔高度范围为海
平面以上 1500 米 (4921 英尺)至不足 2000 米
(6562 英尺)时
和
SPARC Enterprise
M9000 服务器
5 至 28 (41 至 82.4),在安装海拔高度范围为海
平面以上 2000 米 (6562 英尺)至不足 2500 米
(8202 英尺)时
5 至 26 (41 至 78.8),在安装海拔高度范围为海
平面以上 2500 米 (8202 英尺)至 3000 米
(9843 英尺)时
1
无冷凝。
1-8
SPARC Enterprise M8000/M9000 服务器概述指南 • 2007 年 4 月
1.2.4
电源规格
有两种可用的电源输入模式,即单相供电和三相电源输入。
下表列出了单相供电的电源条件。
表 1-4
电源规格
M9000
M8000
项目
仅基本机柜
基本机柜 + 扩充机柜
输入电源:
单相电源输入
电压 [V]
AC200 至 240 10%
50/60 (+2% / -4%)
频率 [Hz]
1
2
3
10.5
21.3
42.6
功耗 [kW]
1
2
3
11.0
22.4
44.8
视在功率 [kW]
电源条件
3.0
电源输入电缆 [m]
插头形状
日本:30 A-250 V,4P 钩锁(X 和 Y 之间的连线必须是单相 200-VAC 连线)
北美:NEMA L6-30P
欧洲:EN60309 (32 A)
插头数量
3 (单供电)
5 (单供电)
10 (单供电)
6 (双供电)
10 (双供电)
20 (双供电)
1 该值适用于安装了 4 个 CPU/内存板单元和 4 个 I/O 单元的情况。
2 该值适用于安装了 8 个 CPU/内存板单元和 8 个 I/O 单元的情况。
3 该值适用于安装了 16 个 CPU/内存板单元和 16 个 I/O 单元的情况。
要使用三相电源,需要使用三相供电选件和用于安装该选件的电源机柜。三相供电有两
种连接方式可供选择:星形连接 (连接中性线和各相)和三角形连接 (连接各相)。
有关三相供电规格的详细信息,请参见 《SPARC Enterprise M8000/M9000 服务器场
地规划指南》。
1.2.5
M8000 服务器组件
了该服务器的后视图。每个图中都显示了系统组件的名称。
双供电选件和三相供电选件可安装在电源机柜中。一台电源机柜连接到 M8000。
第 1 章 系统概述
1-9
电源机柜
风扇单元
电源机柜
电源单元
CPU 内存板
单元
CPU 内存板
单元
I/O 单元
I/O 单元
AC 部分
扩充机柜
基本机柜
图 1-9
M9000 (带有扩充机柜)和电源机柜后视图
1.2.8
操作面板概述
操作面板上具有指示 M8000 和 M9000 服务器的不同状态的 LED 指示灯、用于控制电
源的电源开关和用于设置操作模式的模式开关。
有关操作面板的详细信息,请参见 《SPARC Enterprise M8000/M9000 Servers
Service Manual》。
下图显示了操作面板,该面板的 LED 指示灯和开关如下所述。
第 1 章 系统概述
1-15
操作面板外观
锁定
服务
电源(LED 指示灯)
模式开关
待机(LED 指示灯)检查(LED 指示灯) 电源开关
图 1-10
操作面板
操作面板上的 LED 指示灯
表 1-5
操作面板 LED 指示灯
LED 指示灯
名称
灯光颜色
功能和运行状态说明
电源
待机
检查
绿色
指示是否已打开主单元电源。
如果此 LED 指示灯为亮起状态,则表示已打开电源。
绿色
指示主单元的待机状态。
如果此 LED 指示灯为亮起状态,则表示可以打开电源。
琥珀色
指示主单元的运行状态。(它用于指示维护目标,或指示无
法启动该单元。)
如果此 LED 指示灯为亮起状态,则表示检测到系统错误。
操作面板开关
操作面板上的开关包括模式开关 (用于设置操作模式)和电源开关 (用于打开和关闭
SPARC Enterprise 服务器的电源)。要在系统操作模式和维护模式之间切换,请插入高
端服务器的专用密钥并更改模式开关的设置。
1-16
SPARC Enterprise M8000/M9000 服务器概述指南 • 2007 年 4 月
1.3
服务器组件
本节介绍两种高端服务器的组件。
有关各服务器组件的详细信息,请参见 《SPARC Enterprise M8000/M9000 Servers
Service Manual》。
■
■
■
■
■
■
■
■
■
■
■
■
1.3.1
CPU 模块
CPU 模块 (CPU Module, CPUM) 包含一个 SPARC64 VI CPU 和一个 DC-DC 转换器
(DC-DCconverter, DDC)。一个 CPU/内存单元最多可安装四个 CPU 模块 (CPU
module, CPUM)。
CPUM 具有以下特性:
■
CPUM 包含一个 SPARC64 VI,这是采用了最新 LSI 工艺的高性能多内核 CPU。
■
如果检测到无法预料的错误, SPARC64 VI CPU 可以利用自动恢复功能、自动重试
功能或自动降级功能 (具体取决于系统的配置方式),使系统在不发生中断的情况
下继续运行。
■
借助冗余的 DDC 配置,即使某个 DDC 发生故障,系统也可持续运转。
1-18
SPARC Enterprise M8000/M9000 服务器概述指南 • 2007 年 4 月
1.3.2
CPU/内存板单元
CPU/内存板单元 (CPU/Memory Board Unit, CMU) 包含 CPUM、内存模块和一个
DDC。可将 CMU 和 I/O 单元组合使用以构建一个或多个域。
CMU 具有以下特性:
■
■
■
包含一个采用了最新 LSI 工艺的互连 LSI 模块。
使用双倍数据速率 (Double Data Rate, DDR)II DIMM 内存。
支持 DR 功能,该功能允许在系统运行期间对 CMU 进行热维护和更换,并允许在
系统运行期间添加和删除活动的 CMU。
■
借助冗余的 DDC 配置,即使某个 DDC 发生故障,系统也可持续运转。
1.3.3
I/O 单元
I/O 单元 (I/O unit, IOU) 由一个 PCIe 桥控制 LSI 模块、包含 DDC 的印刷电路板、硬
盘驱动器 (hard disk drive, HDD)、 PCIe 插槽和用于 IOU 的 PCI 盒组成。可将 IOU
和 CMU 组合使用来配置服务器。
IOU 具有以下特性:
■
它包含八个 PCIe 插槽。
■
IOU 板载设备卡 A (IOU Onboard Device Card_A, IOUA) 可用于连接机柜内硬盘
驱动器 (2.5 英寸 SAS 接口)、机柜内 DVD-ROM 驱动器和磁带设备。可以使用安
装在该卡上的 LAN 端口 (1000BASE-T/100Base-TX/100Base-T)。
■
■
■
它支持对外部 I/O 扩展单元和 PCIe 插槽的 PCI 热插拔。
外部 I/O 扩展单元可用于将 IOU 连接到外部 I/O 扩展单元连接卡上。
支持 DR 功能,该功能允许在系统运行期间对 IOU 进行活动维护和更换,并允许在
系统运行期间添加和删除活动的 IOU。
■
■
先将 PCI 卡插入到所提供的其中一个盒中,然后再将其插入 IOU 中的内置 PCIe 插
槽。可将最大长度为 177.8 毫米 (短尺寸)的 PCI 卡安装在插槽中。
借助冗余的 DDC 配置,即使某个 DDC 发生故障,系统也可持续运转。
1.3.4
风扇单元
风扇单元用于对服务器进行冷却。有两种类型的风扇单元,其特性如下:
■
借助冗余的风扇配置,即使在系统运行期间某个风扇发生故障,系统也可持续运转。
可在系统运行期间对有故障的风扇进行热系统维护或更换。
■
第 1 章 系统概述
1-19
1.3.5
电源单元
电源单元 (power supply unit, PSU) 向每个单元供电,并具有以下特性:
■
借助冗余的配置,即使在系统运行期间某个电源单元发生故障,系统也可在不发生
中断的情况下继续运行。
■
可在系统运行期间对有故障的电源单元进行热系统维护或更换。
1.3.6
1.3.7
交叉开关单元
交叉开关单元 (crossbar unit, XBU) 由逻辑地连接 CMU 和 IOU 的交叉开关组成。
XBU 具有冗余的总线路由。如果一条路由出现故障,系统可通过另一条路由重新启动
以继续运行。
时钟控制单元
时钟控制单元 (clock control unit, CLKU) 包含一个用于时钟的 LSI 模块。
CLKU 具有冗余的时钟供给路由。如果一条路由出现故障,系统可通过另一条路由重新
启动以继续运行。
1.3.8
1.3.9
操作面板
操作面板可用于打开和关闭服务器电源、在操作模式间切换,以及显示系统状态信息。
通过使用为面板提供的专用密钥来切换操作模式,可对操作面板上的开关的操作进行限制。
XSCF 单元
XSCF 单元 (XSCF unit, XSCFU) 包括一个专用处理器,该处理器独立于主单元处理器
运行。服务器中的 XSCFU 采用完全相同的配置,以提高容错性。
XSCFU 配备有硬件接口,以便通过网络连接到远程设备 (如个人计算机和工作站)。
远程设备可通过网络连接到 XSCF 以控制系统的启动、设置和操作管理。
XSCFU 提供以下用于进行网络连接的硬件接口:
■
串行端口
■
LAN 端口 (10/100BASE-T/100Base-TX)
1-20
SPARC Enterprise M8000/M9000 服务器概述指南 • 2007 年 4 月
可使用这些接口通过网络连接访问 XSCF。通过 XSCF 提供的命令行界面 (XSCF shell)
和基于浏览器的用户界面 (XSCF Web 页面),可对服务器进行操作和管理。
有关详细信息,请参见 《SPARC Enterprise M4000/M5000/M8000/M9000 Servers
XSCF User’s Guide》。
1.3.10
内部驱动器单元
SPARC Enterprise M8000/M9000 服务器包含以下机柜内驱动器单元。可对它们进行
活动更换或添加:
硬盘驱动器
该硬盘驱动器是一个 2.5 英寸的硬盘驱动器,带有串行连接 SCSI (serial attached SCSI,
SAS) 接口。它可安装在 IOU 中。
DVD-ROM 驱动器单元/磁带机单元
一个服务器中的多个域不能直接共享 DVD 驱动器。但是,如果多个域通过 LAN 互相
连接,并使用 Solaris 操作系统的特定功能,则这些域可以共享此 DVD 驱动器。在域
之间进行 LAN 连接需要充分考虑安全性问题。
1.4
组件安装条件
■
CPUM 可添加到具有两个模块的单元中。
■
双列直插式内存模块 (dual inline memory module, DIMM) 可添加到具有 16 个模块
的单元中。
■
■
如果添加一个 IOU,则必须为具有相同插槽编号的插槽安装一个 CMU。
IOU 板载设备卡 A (IOU Onboard Device Card_A, IOUA) 可安装在 IOU 中的 PCIe
插槽 #0、 #2、 #4 和 #6。
■
外部 I/O 扩展单元连接卡可安装在 IOU 中的 PCIe 插槽 #1、 #3、 #5 和 #7。
第 1 章 系统概述
1-21
1.5
可选产品
以下产品是可用于 SPARC Enterprise M8000/M9000 服务器的主要选件。
■
■
■
有关其他可选产品的信息,请访问我们的 Web 站点。
1.5.1
电源选件
SPARC Enterprise M8000 服务器的电源机柜和可在机架上安装的双供电选件是作为电
源选件提供的。
电源机柜允许采用双供电或三相供电。
SPARC Enterprise M8000 服务器的可在机架上安装的双供电选件从两个互相独立的外
部 AC 电源接收电力,并具有相同的输入电源系统。
要为 SPARC Enterprise M8000 服务器使用单相双供电配置,请将可在机架上安装的双
供电选件安装在机架自身空间中。这要求机柜中具有高度为 6 个 RU 的机架空间。对于
SPARC Enterprise M9000 服务器,您必须添加电源机柜。
要在任一服务器中采用三相供电,则需要另外安装电源机柜。请为每个 SPARC Enterprise
M8000/M9000 服务器安装一个电源机柜。
有关详细信息,请参见 《SPARC Enterprise M8000/M9000 服务器场地规划指南》。
注 – 三相供电选件只能在装运前在工厂中安装。装运出厂后,单相供电不能更改为三
相供电,反之亦然。
1-22
SPARC Enterprise M8000/M9000 服务器概述指南 • 2007 年 4 月
表 1-7
电源机柜和 M8000/M9000 双供电选件的规格
可在机架上安装的
双供电选件
项目
电源机柜
317
489
1003
外围尺寸
宽度 [mm]
深度 [mm]
高度 [mm]
1244
1800
350
278(6U)
75
重量 [kg]
输入电源:单相电源 电压 [V]
输入
相数
AC200 至 240 10%
单相
50/60 +2%, -4%
频率 [Hz]
注 – 有关三相供电选件的规格,请参见 《SPARC Enterprise M8000/M9000 服务器场
地规划指南》。
1.5.2
外部 I/O 扩展单元
外部 I/O 扩展单元是用于添加 PCI 插槽的可选产品。在 19 英寸机架中,外部 I/O 扩
展单元的高度为四个 RU (rack unit,机架单元),大约为 18 厘米。
通过使用六个 PCIe 插槽或六个 PCI-X 插槽,外部 I/O 扩展单元最多可容纳两个 I/O 船。
■
每个 I/O 船中的 PCIe 插槽:短尺寸到长尺寸 (达 312 毫米)
■
每个 I/O 船中的 PCI-X 插槽:短尺寸到长尺寸 (达 312 毫米)
另外,也可活动添加和更换外部 I/O 扩展单元中的所有插槽。
有关详细信息,请参见 《I/O Expansion Box Installation and Service Manual》。
第 1 章 系统概述
1-23
图 1-11
外部 I/O 扩展单元
1.5.3
SPARC Enterprise M9000 服务器 (扩充机柜)选件
SPARC Enterprise M9000 服务器 (基本机柜)配置最多可包含 32 个 CPU 模块 (64 个
内核)、 2TB 内存和 224 个 PCI 插槽。如果配置所包含的组件多于上述组件,则需要使
用 SPARC Enterprise M9000 服务器的扩充机柜选件。
含有 SPARC Enterprise M9000 服务器(扩充机柜)的配置最多可包含 64 个 CPU 模块
(128 个内核)、 4TB 内存和 288 个 PCI 插槽。
有关连接 SPARC Enterprise M9000 服务器(扩充机柜)和 SPARC Enterprise M9000
服务器 (基本机柜)的信息,请参见 《SPARC Enterprise M8000/M9000 服务器安装
指南》。
1.6
软件特性
SPARC Enterprise M8000/M9000 服务器使用 XSCF 来管理和监视系统。
可将 Solaris 操作系统安装为域中使用的操作环境。
1-24
SPARC Enterprise M8000/M9000 服务器概述指南 • 2007 年 4 月
第2章
系统特性
本章介绍以下技术方面的内容,其中包括特性和结构。
■
■
■
■
2.1
硬件配置
本节介绍硬件配置,其中包括以下各项:
■
■
■
■
■
2.1.1
CPU
SPARC Enterprise M8000/M9000 服务器使用 SPARC64 VI CPU,这是一个专用的高
性能多内核处理器。单片 L2 高速缓存内存最大限度地缩短了内存延迟。
实现了指令重试功能,所以可在检测到错误时通过重试指令继续进行操作。
SPARC Enterprise M8000 服务器、 SPARC Enterprise M9000 服务器和带有扩充机柜
的 SPARC Enterprise M9000 服务器分别支持多达 16、 32 或 64 个 CPU 模块,可充分
利用系统的可伸缩性。
2-1
可在一个系统中使用以不同的时钟频率运行的 CPU 模块。
因此,在需要提高处理性能时,可安装最新的 CPU。
2.1.2
2.1.3
内存子系统
内存子系统负责控制内存访问和高速缓存内存。该服务器使用 DDR-II DIMM 内存。
每个 CMU 具有三十二个内存插槽。
另外, SPARC Enterprise M8000 服务器、 SPARC Enterprise M9000 服务器和带有扩充
机柜的 SPARC Enterprise M9000 服务器可分别安装多达 128、 256 或 512 个 DIMM。
内存子系统使用多达八路交错,从而可提供速度更快的内存访问。
CMU 中的每对内存总线都支持内存镜像模式。这样,如果一条总线出现错误,则可使
用其他未出现故障的总线继续进行操作。内存镜像模式可由系统管理员进行设置。
I/O 子系统
I/O 子系统负责控制主单元与 I/O 设备之间的数据传输。这些服务器使用 PCIe 作为
I/O 设备的互连总线。
每个 IOU 都包含八通道 (x8) PCIe 插槽。另外,可将八通道 PCIe 插槽或 133-MHz
64 位 PCI-X 插槽安装于外部 I/O 扩展单元中。
SPARC Enterprise M8000 服务器、 SPARC Enterprise M9000 服务器和带有扩充机柜
的 SPARC Enterprise M9000 可分别安装多达 32、 64 或 128 个与 PCIe 兼容的卡。
通过 PCI-Express 插槽安装外部 I/O 扩展单元,可以添加 PCI-Express 插槽或 PCI-X
插槽。
2.1.4
系统总线
包含 CPU 和内存子系统的 CMU 和包含 I/O 子系统的 IOU 中的每个组件用于通过交
叉开关在所有组件之间进行高吞吐量数据传输。交叉开关具有完全相同的总线路由。如
果一个交叉开关出现错误,系统可重新启动以隔离有故障的开关,从而使高端服务器可
以继续运行。
2-2
SPARC Enterprise M8000/M9000 服务器概述指南 • 2007 年 4 月
注 – SC 是控制 CPU 和内存并处理与 XB 之间的通信的系统控制器。
2.1.5
系统控制
该服务器的系统控制是指包含在运行 XSCF 以及由 XSCF 控制的每个组件的 XSCFU 中
的系统控制。
只要为服务器提供输入电源, XSCF 就会持续不断地监视该服务器,即使关闭了所有域
的电源也是如此。
提供了以下功能以提高系统可用性:
■
■
■
■
■
■
■
■
■
配置管理和监视
冷却单元 (风扇)监视
域状态监视
打开和关闭外围设备的电源1
通过异常情况监视完全控制并监视服务器
用于域配置和管理的远程分区
由用户通过外部网络连接管理和监视服务器的功能
将服务器上的错误信息通知给系统管理员
远程控制台输入/输出
2.2
分区
可将一个 SPARC Enterprise M8000/M9000 服务器机柜划分为多个独立的系统以便进
行操作。这种划分功能称为分区。
本节介绍分区特性以及可通过分区实现的系统配置。
1. 连接的设备必须具有相同的接口方可奏效。
2-4
SPARC Enterprise M8000/M9000 服务器概述指南 • 2007 年 4 月
2.2.1
2.2.2
特性
通过分区生成的各个系统可内置在 SPARC Enterprise M8000/M9000 服务器中。这些
划分出的各个系统称为域。域有时称为分区。
通过分区,可以任意分配服务器中的资源。另外,通过分区,还可以根据作业负荷或处
理量采用灵活的域配置。
独立的操作系统可以在域中运行。每个域都受硬件的保护,以便其不受其他域的影响。
例如,一个域中的基于软件的问题 (如 OS 出现紧急情况)不会直接影响到在其他域中
的作业。另外,每个域中的操作系统都可以独立地复位和关闭。
域硬件要求
组成域的基本硬件资源为高端服务器中安装的 CMU 和 IOU 或由 CMU 组成的物理系
统板 (physical system board, PSB)。
可以将 PSB 逻辑划分为一个部分 (不作划分)或四个部分。 PSB 划分出的每个部分的
物理单元配置称为扩展系统板 (extended system board, XSB)。
逻辑划分为一个部分 (未作划分)的 PSB 称为单 XSB (Uni-XSB),逻辑划分为四个部
分的 PSB 称为四 XSB (Quad-XSB)。
可使用这些 XSB 的任意组合来配置域。 XSCF 用于配置域并指定 PSB 划分类型。
第 2 章 系统特性
2-5
2.2.3
域配置
无论划分出的 XSB 是单 XSB 还是四 XSB,都可以对服务器中的任何 XSB 进行组合来配
置域。
可以按任意组合使用这些 XSB,以实现灵活的域配置。另外,一个 XSB 的资源数量可
根据 PSB 的划分类型进行调整。因此,可根据作业操作所需的资源数量来配置域。
XSCF 用户界面用于配置域。每个配置的域都由 XSCF 管理。
服务器中可配置的域的最大数量取决于系统。 SPARC Enterprise M8000 服务器中最多
可配置 16 个域,而 SPARC Enterprise M9000 服务器中最多可配置 24 个域。
要配置域,必须首先分配 LSB 编号,以便逻辑系统板 (logical system board, LSB) 可用
作 XSB 的 LSB。
此 LSB 编号会被 Solaris 操作系统引用,而且必须在域中是唯一编号。但是,如果多个
域共享一个 XSB,则不需要在域中定义公用 LSB 编号。可为每个域中的此设置分配一
个任意的 LSB 编号。
将会针对每个域进行域配置设置。可通过指定 XSB 以及此 LSB 编号来配置域。
一个域中最多可配置 16 个 XSB。
指定域配置和划分类型时,用户必须考虑以下因素以及资源数量:
■
单 XSB 类型适合于需要大量资源的域的配置。此外,单 XSB 类型的 XSB 由 CMU
和 IOU 的物理配置单元分隔开。因此,如果 CPU 或内存中发生硬件错误,可以轻
松地更换硬件而不会影响到其他域。但是,由于 PSB 指定的范围中可能有错误,资
源数量会减少。
■
四 XSB 类型适合于小规模域的配置以及经过优化以实现灵活资源管理的配置。但
是,由于域在 PSB 中是按逻辑分隔开的,因此,在 PSB 中共享的硬件中的错误可能
会影响其他域。
此外,可在各个 XSB 中添加和删除已配置域的资源,并且可在域之间移动这些资源。
第 2 章 系统特性
2-7
2.3
资源管理
本节介绍以下功能,这些功能支持在系统运行期间动态重新配置域资源:
■
■
■
■
2.3.1
动态重新配置
通过动态重新配置 (Dynamic reconfiguration, DR),可以在系统不停止运行的情况下
动态地添加和移除系统板上的硬件资源。因此, DR 使得系统资源能够进行最佳重定
位。此外,如果发生故障, DR 可将系统置于可活动更换有故障的组件的状态。
使用 DR 功能,可以根据作业扩充或新作业的需要来添加或分发资源,并且可将其用于
以下目的:
■
有效使用系统资源
通过保留某些资源,可根据工作负荷每天、每月或每年的变化添加保留的资源。这
样,便可以根据数据量和工作负荷的变化,在需要一天 24 小时、一年中每天都要运
行的系统上灵活地分配资源。
■
活动更换系统资源
如果使用多个系统板的系统资源配置的域的 CPU 发生故障,通过 DR 功能,可在不
停止系统的情况下动态地隔离有故障的 CPU。可在原始域中动态地配置所替换的
CPU。
有关动态重新配置的详细信息,请参见 《SPARC Enterprise
M4000/M5000/M8000/M9000 Servers Dynamic Reconfiguration (DR) User’s
Guide》。
第 2 章 系统特性
2-9
2.3.2
2.3.3
PCI 热插拔
通过 PCI 热插拔功能,可在 Solaris 操作系统中添加或移除 PCI 卡,而无需重新引导系统。
PCI 热插拔功能的用途示例如下所示:
■
在系统运行期间更换或移除有故障或可能会发生故障的 PCI 卡
■
在系统运行期间添加 PCI 卡
有关 PCI 热插拔功能的详细信息,请参见《SPARC Enterprise M8000/M9000 Servers
Service Manual》。
即需即用
即需即用 (Capacity on Demand, CoD) 是一项可选的服务,它允许用户为服务器购买
备用处理资源 (CPU)。这些备用资源以安装于服务器中的 COD 板上的一个或多个
CPU 的形式提供。不过,要访问这些 CPU,必须首先购买它们的 COD 使用权 (right-
to-use, RTU) 许可证。
注 – RTU 表示适用于每个 CPU 的许可证。要使用具有事先购买的额外数目 CPU RTU
的 CPU,用户需要为每个系统板购买其他的 RTU 处理器。 CPU 的使用权许可证指定
可在整个系统中使用的 CPU 数目。系统管理员决定要为其分配使用权的系统板和域。
CPU 的使用权许可证指定可在整个系统中使用的 CPU 数目。系统管理员决定要为其分
配使用权的系统板和域。
有关 COD 的详细信息,请参见 《SPARC Enterprise M4000/M5000/M8000/M9000
Servers Administration Guide》。
2.3.4
区域 (Zone)
Solaris 10 OS 有一个称为区域的功能,该功能可以划分处理资源并将这些资源分配给应
用程序。
在域中,可将资源划分成称为容器的部分,并且这些处理部分会被分配给每个应用程
序。可在各个容器中独立地管理这些处理资源。如果某个容器中出现了问题,则该容器
会被隔离,从而不会影响其他容器。这样,便可以灵活地分配资源,在考虑到处理负荷
的同时实现最佳资源管理。
2-10
SPARC Enterprise M8000/M9000 服务器概述指南 • 2007 年 4 月
2.4
RAS
RAS 是与可靠性 (Reliability)、可用性 (Availability) 和可维护性 (Serviceability) 相关
的功能的首字母缩略词。
SPARC Enterprise M8000/M9000 服务器的 RAS 可对相应位置进行错误检查,并对错
误检查进行集中式监视和控制,从而最大限度地减少了系统停机时间。
另外,还可以使用群集软件或集中式管理软件来配置 SPARC Enterprise
M8000/M9000 服务器,以增强 RAS 功能。
也可以在不影响正在运行资源的情况下执行任何计划的系统停机 (如定期维护或系统
配置更改)。这可以显著地增加服务正常运行时间。
2.4.1
可靠性
要提高质量并获得高可靠性,在选择相应组件时必须考虑产品的生命周期以及产生错误
时的响应情况。
可靠性对于硬件和软件具有同等的重要性。
此外,不仅程序错误可以触发软件错误,而且硬件错误也可触发软件错误。
SPARC Enterprise M8000/M9000 服务器可提供以下功能以实现高可靠性:
■
■
■
由 XSCF 进行监视,以定期检查软件 (如 Solaris 操作系统)是否在域中运行 (主
机监视器监视)。
定期执行内存巡查 (patrol) 以检测内存软件错误和关联故障 (即使是通常不使用的
内存区),来防止使用有故障的内存,从而防止发生由故障内存引起的系统故障。
由于 ECC 可保护所有路由 (包括计算单元、寄存器、高速缓存内存和系统总线)中
的功能性数据,因此,所有的 1 位错误可通过硬件自动修正以确保数据完整性。
2.4.2
可用性
通过服务器是否容易发生故障,以及用户从故障中恢复的迅速程度来确定可用性。系统
可用的时间量以百分比形式表示。
无法完全消除系统中的硬件和软件故障。要提供高可用性,系统必须包含这样的机制,
即,即使硬件 (如组件和设备)或软件 (如操作系统或应用程序软件)中出现故障,
系统也可以持续运转。
SPARC Enterprise M8000/M9000 服务器可提供下面列出的功能,以获得高可用性。
也可通过将服务器与群集软件或管理软件组合使用,来获得更高的可用性。
第 2 章 系统特性
2-11
■
■
■
■
■
■
■
■
支持电源和风扇的冗余配置和热更换
支持磁盘的冗余配置,通过软件进行镜像和活动更换
扩展了内存、系统总线和 LSI 内部数据中临时故障的自动修正范围
支持针对检测到的故障的增强型重试功能和降级功能
通过利用系统自动重新引导缩短停机时间
缩短系统启动所用的时间
通过 XSCF 收集故障信息,并使用不同类型的警告进行预防性维护
支持内存子系统中的 Chipkill 功能,该功能允许连续处理一位错误修正,以响应由
内存设备故障引起的连续的突发读取错误
■
■
支持内存镜像功能,允许通过其他内存总线进行正常的数据处理,从而防止系统在
响应连接到内存总线的总线或设备上的错误时出现故障
内存巡视功能对软件操作的工作负荷没有影响,因为该功能是在硬件中实现的
2.4.3
可维护性
通过是否容易诊断服务器故障,以及服务器从故障中恢复的迅速程度或是否容易修正故
障来确定可维护性。
要实现高可维护率,必须能够确定组件或设备故障的原因。为了便于从故障中的恢复,
系统必须确定故障的原因,并隔离有故障的组件以进行更换。系统还必须以易于理解的
格式 (防止误解)向系统管理员和/或现场工程师通知该事件和情况。
SPARC Enterprise M8000/M9000 服务器可提供以下解决方案以实现高可维护性:
■
安装在操作面板上的状态 LED 指示灯,用于指示主要的可更换组件和适合活动更换
的组件
■
■
通过 XSC 远程识别设备运行状态并进行远程维护
LED 指示灯闪烁功能,用于指示维护目标 (检查 LED 指示灯 (CHECK-LED),也
称为定位器)
■
■
■
为系统管理员和现场工程师提供标记于不同类型的标签上的注释和警告
自动通知,用于向系统管理员和现场工程师报告不同类型的故障
从数据中心对复杂系统进行集中式系统化监视 (如支持 SNMP)
2-12
SPARC Enterprise M8000/M9000 服务器概述指南 • 2007 年 4 月
第3章
关于软件
本章介绍以下软件功能。
■
■
3.1
Solaris 操作系统功能
Solaris 操作系统 (Solaris Operating System, Solaris OS) 具有以下特性:
■
■
■
■
■
■
■
历经多年打造的 Solaris 可靠性
关联,可充分展示 SPARC 体系结构的硬件性能
来自 ISV 的各种产品 (应用程序软件和中间件)
使用分区和 DR 功能进行资源优化
使用 PCI 热插拔动态添加/更改 IO 设备
使用 Solaris 容器技术在 Solaris 区域中进行资源管理
与 XSCF 协作进行高级系统管理
有关 Solaris 操作系统的详细信息,请参见以下 URL 中的手册。
不管软件套件的功能如何,Solaris 操作系统都具有以下功能,用于与 SPARC Enterprise
服务器硬件进行通信:
■
■
3-1
3.1.1
3.1.2
域管理
在 SPARC Enterprise M8000/M9000 服务器中,通过系统独有的分区功能,可将物理
系统板 (physical system board, PSB) 逻辑划分为一个部分 (不作划分)或四个部分。
逻辑划分为一个部分 (未作划分)的 PSB 称为单 XSB (Uni-XSB),逻辑划分为四个部
分的 PSB 称为四 XSB (Quad-XSB)。
PSB 划分出的每个部分的物理单元配置称为扩展系统板 (extended system board, XSB)。
在 SPARC Enterprise 系统中,可使用这些 XSB 的任意组合来配置域。
PCI 热插拔
SPARC Enterprise M8000/M9000 服务器支持为特定的 PCI-Express 和 PCI-X 热插拔
控制器插入和移除 PCI 卡。移除 PCI 卡之前,请确保使用 Solaris OS cfgadm(1M)命
令取消设置并将该卡隔离,并确保该卡在物理上是可移除的。
有关 PCI 热插拔的详细信息,请参见 《SPARC Enterprise
M4000/M5000/M8000/M9000 Servers Administration Guide》。
3.2
XSCF 固件功能
XSCF 固件是一种系统控制设备,其中包含一个独立于服务器中的处理器的专用处理
器。本节介绍 XSCF 固件的特性,并对 XSCF 固件功能进行概述。
3.2.1
XSCF 特性
XSCF 是预先安装并在 XSCFU 中作为标准设备运行的固件。只要为服务器提供输入电
源, XSCF 就会持续不断地监视并管理该服务器,即使关闭了域的电源也是如此。此
外, XSCF 还提供用户界面,用户可通过该界面对服务器进行操作和管理。
XSCFU 具有一个串行端口和 LAN 端口作为外部接口。个人计算机或工作站等终端可
通过串行连接或以太网连接连接到 XSCF 上。
可通过 XSCF 提供的基于命令行的 XSCF shell 或基于浏览器的 XSCF Web 页面对该服
务器进行操作和管理。
通过串行连接只能使用 XSCF shell。通过以太网连接既可使用 XSCF shell 也可使用
XSCF Web 页面。
3-2
SPARC Enterprise M8000/M9000 服务器概述指南 • 2007 年 4 月
注 – XSCFU 支持冗余配置 (重复配置)以实现高可靠性。
当前控制服务器的 XSCF 称为活动 XSCFU,其他 XSCF 称为待机 XSCF 或待机
XSCFU,因为它充当活动 XSCF 的备用项。
活动 XSCF 和待机 XSCF 相互监视以实现故障转移机制,以便在其中的一个检测到另一
个中出现错误时,在活动 XSCF 或待机 XSCF 之间切换。
和 《SPARC Enterprise M4000/M5000/M8000/M9000 Servers eXtended System
Control Facility (XSCF) User’s Guide》。
3.2.1.1
基于命令行的用户界面 (XSCF shell)
XSCF shell 是一个可通过终端 (如个人计算机或工作站)使用的基于命令行的用户界
面,该终端通过串行连接或以太网连接连接到 XSCF。
使用串行连接时,终端直接连接到服务器,以使用由 XSCF 提供的 shell 命令。另外,
通过 XSCF 的控制台重定向功能,可将终端用作操作系统控制台。
使用以太网连接时,终端通过安全 Shell (Secure Shell, SHH) 或 telnet 连接到 XSCF,
以使用由 XSCF 提供的 shell 命令。
以下是可使用 XSCF shell 执行的主要操作:
■
■
■
■
■
■
显示服务器配置或状态以及各种相关设置
显示域配置或状态以及各种相关设置
启动或关闭某个域
对各种网络服务进行设置
对各种安全性功能进行设置
为远程维护服务功能进行各种设置
3.2.1.2
基于浏览器的用户界面 (XSCF Web)
XSCF Web 是一个可通过终端 (如个人计算机或工作站)使用的基于浏览器的用户界
面,该终端通过以太网连接连接到服务器。
但是,通过串行连接无法使用 XSCF Web 页面。如果终端的浏览器功能用于连接到
XSCF,则可以执行 BUI 操作。
第 3 章 关于软件
3-3
3.2.2
XSCF 功能概述
本节对 XSCF 支持的主要功能进行了概述。
有关各个功能的详细信息,请参见 《SPARC Enterprise
M4000/M5000/M8000/M9000 Servers eXtended System Control Facility (XSCF)
User’s Guide》。
3.2.2.1
系统管理
XSCF 的主要任务是控制和监视整个 SPARC Enterprise 系统,例如,对服务器的冷却
组件 (风扇单元)的配置管理和监视、域状态监视、外设单元的通电和断电,以及错
误监视。另外, XSCF 还提供用于域配置和管理的分区功能。
XSCF 会持续不断地监视服务器状态,所以系统可以稳定地运行。
检测到系统中存在任何错误时,系统状态监视机制会立即收集有关该硬件的错误信息
(硬件日志),并对其进行分析以确定错误位置并检查错误状态。 XSCF 将显示该状态,
并根据需要降级相关组件或域,或复位系统,从而防止错误再次发生。
XSCF 为整个系统提供高可靠性、高可用性和高可维护性。
3.2.2.2
3.2.2.3
3.2.2.4
安全性管理
XSCF 管理 XSCF 的用户帐户。可根据用户帐户类型和设置,限制在 XSCF shell 和 XSCF
Web 页面中执行的操作范围。此外, XSCF 还提供 IP 地址过滤功能 (以允许对 XSCF 进
行访问)以及加密功能 (使用 SSH 和 SSL)。系统运行期间发生的操作员错误和未经授
权的访问会记录在日志中。系统管理员可使用这些功能来调查系统问题的原因。
系统状态管理
XSCF 提供了一些功能,这些功能可以用作 XSCF 操作,用于显示系统配置状态、创建
和更改域配置定义,以及启动和停止域。而且, XSCF 还提供了 DR 功能,该功能可在
域运行期间参与动态更改系统板配置。因此,可针对作业操作优化域资源。此外,
XSCF 将与 Solaris 操作系统联合管理 CPU、内存和 I/O 资源。
错误检测和管理
XSCF 会持续不断地监视系统状态,所以系统可以稳定地运行。检测到系统中存在任何
错误时, XSCF 会立即收集有关该硬件的错误信息 (硬件日志),并对其进行分析以确
定错误位置。为了继续运行, XSCF 将根据错误条件在必要时降级相关组件,或复位系
统,从而防止问题再次发生。因为以这种方式向用户提供了有关硬件错误和故障位置的
易于理解的准确信息,所以用户可迅速地对问题采取措施。
3-4
SPARC Enterprise M8000/M9000 服务器概述指南 • 2007 年 4 月
3.2.2.5
3.2.2.6
远程系统控制和监视
XSCF 提供了用于通过以太网连接监视服务器的功能,所以用户可以远程管理该服务
器。此外,还支持向系统管理员报告错误信息的功能,以及远程控制台输入/输出功
能。因此,提高了系统可用性。
资源管理
XSCF 会对已配置域和系统板的硬件资源进行管理。至于资源管理,则提供了允许动态
重新配置域的 DR 功能。此外,还提供了 COD,以实现按许可证购买的 CPU 的资源
管理。
动态重新配置 (Dynamic Reconfiguration, DR)
XSCF 可在系统运行期间参与动态更改系统板配置。 XSCF 可用于动态重新配置域。
有关 DR 的详细信息,请参见 《SPARC Enterprise M8000/M9000 Servers Service
Manual》。
即需即用 (Capacity on Demand, CoD)
要使用 CoD,必须购买 RTU。然后,必须根据购买的 RTU 数目配置 CPU 等资源,以
便可以根据需要使用这些资源。由于启动某个域或另一触发器而需要使用这些资源时,
会将已定义的许可证分配给各个资源。
有关详细信息,请参见 《SPARC Enterprise M4000/M5000/M8000/M9000 Servers
Administration Guide》。
第 3 章 关于软件
3-5
3-6
SPARC Enterprise M8000/M9000 服务器概述指南 • 2007 年 4 月
词汇表
B
BUI Browser-based user interface (基于浏览器的用户界面)。
C
Capacity on Demand,
CoD (即需即用) 一种选项,用于在需要时提供附加的 CPU 处理资源。将会在服务器中安装的
COD CPU 板上提供这些附加 CPU。要访问这些 COD CPU,必须购买它们的
COD 使用权 (right-to use, RTU) 许可证。
CLI Command-line interface (命令行界面)。
clock control unit,
CLKU (时钟控制
单元) 由时钟板和机械组件组成的单元。这是一个活动的可更换单元。
CPU Central processing unit (中央处理器)。
CPU/Memory Board
unit, CMU
(CPU/内存板单元) 在 SPARC Enterprise M8000/M9000 服务器中,CPU/内存单元由 CPU、内 存 和
CMU 通道组成。
词汇表-1
CPU module, CPUM
(CPU 模块) 包含一个或两个 CPU 芯片的模块。
crossbar, XB
(交叉开关) 用于控制系统控制器 (System Controller, SC) 和 I/O 之间数据传输的开关 ASIC。
Crossbar unit, XBU
(交叉开关单元) 安装交叉开关大规模集成 (电路) (XB ASIC) 的板。交叉开关单元用于 SPARC
Enterprise M9000 机型。在带有扩充机柜的 SPARC Enterprise M9000 机型中,
交叉开关单元之间的电缆同各个机箱相连。
D
dual power feed
(双供电) 包含两条供电线路的高可靠性系统的供电类型。如果一条线路停止供电,另一条
线路不会停止,从而让系统能够继续运行。
dynamic
reconfiguration, DR
(动态重新配置) 允许逻辑连接和断开连接系统板和系统,而不会导致系统停机。该过程是在
Solaris OS 运行的同时物理安装或移除系统板。
允许电气隔离板与域 (deleteboard),以便可以将板从系统物理移除或添加到其
他域;或者重新电气连接板 (addboard),以便将板插入正在运行的服务器或分
配给其他域。
E
ECC Error Correction Code (纠错码)。
eXtended system board,
XSB (扩展系统板) 扩展系统板组合了物理系统板的硬件资源。 SPARC Enterprise 服务器可从一个物
理系统板中生成一个或四个 XSB:单 XSB (Uni-XSB) 和四 XSB (Quad-XSB)。
eXtended System
Control Facility, XSCF
(扩展系统控制设备) 一种服务处理器上运行,并为服务器提供控制和监视功能的软件。
eXtended System
Control facility unit,
XSCFU
(扩展系统控制
设备单元) 服务器的 XSCF 板,其中包含系统管理功能,并且使用独立的处理器。
词汇表-2
SPARC Enterprise M8000/M9000 服务器概述指南 • 2007 年 4 月
F
fan (风扇) 使服务器中气流流通的设备。
firmware (固件) 固件是用来控制服务器的软件。 SPARC Enterprise M8000 和 SPARC Enterprise
SAS 控制器、 GbE 控制器以及外部 I/O 扩展单元的控制程序都可视为固件。
I
I/O unit, IOU
(IO 单元) I/O 单元是中端和高端服务器中的常见单元,用来监视 I/O 事件以及支持 PCIe。
此外,中端服务器还支持 PCI-X 卡。必须先将 PCI 卡插入 PCI 盒中。中端服务器
的 I/O 单元最多可支持五个 PCI 盒:四个 PCI-Express 盒 (上面的四个插槽)
和一个 PCI-X 盒 (最下面的插槽)。
L
logical system board,
LSB (逻辑系统板) 软件可识别的内存、 CPU 和 I/O 的分组单元。域中已分配了系统板编号的物理
系统板 (physical system board, PSB) 或扩展系统板 (eXtended System Board,
XSB) 识别为逻辑系统板。一个域最多可包含 16 个逻辑系统板。这些系统板可以
由 XSB 和 PSB 组合而成。
M
mode switch
(模式开关) 服务器上用于控制以下系统模式的物理钥控开关:锁定和维修。
词汇表-3
O
operator panel, OPNL
(操作面板) 一个包含系统指示器、机柜电源控制按钮和机柜模式开关的面板。
OS Operating system (操作系统)。
P
PCI cassette
(PCI 盒) 用于容纳 PCI 卡的容器。共有两种类型:PCIe 和 PCI-X。
PCI-Express
(PCIe) 高速串行点到点互连。
PCI hot plug, PHP
(PCI 热插拔) 在系统运行过程中活动插入或移除 PCI 卡,这支持服务器中的 PCI 插槽。
PCI-X 并行总线 PCI 标准的更快版本。 PCI-X 总线具有改进的协议和更快的时钟速率。
physical system board,
PSB (物理系统板) 一个物理系统板 (physical system board, PSB)。PSB 提供 CMU 配置以及 CMU
和 IOU 配置。
power supply unit, PSU
(电源单元) 接收 AC 输入并提供多种电压。
Q
Quad-XSB (四 XSB) 物理系统板上配置了硬件资源的分隔系统板 (分成四部分)。请参见 eXtended
system board (扩展系统板)。
词汇表-4
SPARC Enterprise M8000/M9000 服务器概述指南 • 2007 年 4 月
R
S
RCI 请参见远程机柜接口。
SAS Serial Attached SCSI (串行连接 SCSI),一种基于行业标准的串行硬件驱动器接口。
serial attached SCSI,
SAS (串行连接
SCSI) 从并行 SCSI 演变为点到点串行外围接口 (其中的控制器直接连接到磁盘驱动器)。
SAS 是对传统 SCSI 的改进,因为 SAS 允许用更细、更长的电缆连接不同大小和类
型的多个设备。
Service Processor
(服务处理器 ) 一种使用独立处理器的小型系统,它指示执行如下操作:启动系统、进行重新配
置、进行故障诊断以及授予访问域的权限。系统管理软件 (XSCF) 就在其中运行。
U
Uni-XSB (单 XSB) PSB 上未划分硬件资源的系统板。
X
词汇表-5
词汇表-6
SPARC Enterprise M8000/M9000 服务器概述指南 • 2007 年 4 月
Y
硬件配置
Z
资源管理
组件
CPU 模块, 1-18
CPU/内存单元, 1-19
组件名称
M8000 后视图, 1-9
M8000 正视图, 1-9
M9000 (带有扩充机柜)后视图, 1-13
M9000 (带有扩充机柜)正视图, 1-13
M9000 (仅基本机柜)后视图, 1-11
M9000 (仅基本机柜)正视图, 1-11
索引 -2
SPARC Enterprise M8000/M9000 服务器概述指南 • 2007 年 4 月
|