客户操作及代码说明
EMC客户服务支持团队
1/8/2010
本文档仅供EMC客户使用,未经EMC公司授权,不得复制、转载、出版和传播
EMC公司推荐客户使用EMC 远程监控及支持系统(包括call home,Webex、ESRS等多种模式),客户也可以通过本文中提及的方法,实现对EMC Symmetrix DMX系列产品的监控。
一、在主机上建立或更新存储设备信息:
这个操作在监控主机上执行一次后,将会在监控主机上建立存储设备信息的数据库,以后只有在存储设备配置变更后,才需要重新执行,用来更新存储配置信息。
登录到安装有Solutions Enabler的主机,执行以下命令(需要一至二分钟):
symcfg discover
Solutions Enabler安装目录
UNIX: /usr/symcli/bin
Windows: C:\\Program Files\\EMC\\SYMCLI\\bin
二、使用以下命令列出该主机所连接的存储信息:
symcfg list
列出主机所连接的存储,包括local和remote,输出示例如下:
S Y M M E T R I X
Mcode Cache Num Phys Num Symm SymmID Attachment Model Version Size (MB) Devices Devices
000290xxxx26 Local DMX4 5773 65536 0 1042
000290xxxx82 Remote DMX4 5773 65536 0 353
三、查看存储设备的日志信息:
symevent -sid 收集序列号为SN的盘阵在start date到end date之间的日志信息。例如:symevent -sid 19 list -start 12/20/2009 此命令为收集序列号尾数为19的盘阵在2009年12月20日以来的日志信息。 如果仅有以下输出: Symmetrix ID: 000290xxxx19 则表明存储系统在此期间没有Event出现。 如果输出示例如下: Symmetrix ID: 000290xxxx19 Time Zone : GMT Standard Time Event at Tue Feb 24 08:20:18 2009: Reporting Director : DF-1A Source : Service Processor Category : Environment Severity : Error Numeric Code : 0x006a Event Code Symbol : SYMAPI_SEVT_DAE_PSB_FAULTED Description : Environmental Error: Power Supply B faulted 需要关注以下几项: Detection time : 日志时间,为存储设备时间,可能与本地实际时间不同。Reporting Director : 事件是从哪个director报出来的 Severity : 事件等级,分为information,warning,error,fatal。 Event Code Symbol : 事件代码缩写,如上例,可用DAE_PSB_FAULTED在下面的ERROR CODE 列表中查找 Description : 事件描述,上例中可知道是连接到director 1A的DAE的Power supply B故障。 上面事件表明在此期间有DAE_PSB_FAULTED的Error Code出现,同一个事件代码可能会同时通过多个部件报出来,可以收集下面第四点所说的收集相关的命令输出,与EMC联系,进行进一步检查。 常见的Event Code可查阅本文附件。 四、发现Error Code / Event Code后的处理: 请客户致电EMC服务支持热线800 819 0009(手机用户可拨打 400 670 0009),提供机器序列号,报告故障现象并提供以下的命令输出配合故障诊断。 (以下命令针对序列号尾数为19的存储) symevent -sid 19 list -v -start 10/30/2009:9:00 -end 10/30/2009:17:00 symcfg -sid 19 –v list -env_data symcfg -sid 19 –v list -env_data -service_state failed symcfg -sid 19 –v list -env_data -service_state degraded symdev -sid 19 –v list -hotspare symdisk -sid 19 -v -spare_info -hotspare list EMC公司收到客户的信息及资料后,会立即安排技术支持工程师进行分析处理,随后会安排工程师到客户现场进行进一步处理工作,现场工作可能包括数据采集、错误修复、部件更换等。 本文附件列举了大量的Event Code及其对应的说明,常见的告警及错误都在列表中,如果发现有不在列表中的Event Code,请拨打800或者400热线向EMC技术支持中心了解详细信息。 五、输出存储设备日志到文件 部分客户系统环境中安装有客户自己开发的监控系统或者第三方公司的监控系统,客户如果需要让监控系统读到设备日志,可以利用以下这个命令: symevent -sid SID list -start mm/dd/yyyy:hh:mm:ss -end mm/dd/yyyy:hh:mm:ss -v -warn > symevent_SID_yyyymmdd.log 这里举个例子,例如需要列举设备序列号尾数为1440的存储设备日志,时间范围是2009/12/24 22:00到第二天23:00 symevent -sid 1440 list -start 12/24/2009:22:00:00 -end 12/25/2009:23:00:00 -v -warn > symevent_1440_20091225.log 那么就得到一个25小时范围的存储设备日志文件,文件名是 symevent_1440_20091225.log。文件名可以由客户在输入命令时自行设定。 附件:常见Error Code / Event Code