最新
推荐
2014年高等教育信息化十大“关... 01-04 教育部成立教育信息化专家组 12-24
CERNET第二十一届学术年会 11-24 李志民:互联网促进人类文明迈... 11-15
|
3. 灾难响应及处理 (1)响应 当灾难发生,服务中断,各相关值班人员首先应冷静,判断灾难的影响程度和损害程度,第一时间恢复。如果短时间内恢复不能成功,通知相应各科室负责人和中心领导,相关科室工程师应迅速就位,处理和恢复突发灾难,短时间内仍不能恢复服务,启动系统故障恢复计划,或各系统数据备份计划。 (2)灾难处理 针对服务中断原因,制定不同的恢复策略。服务中断可能是由于各种不同的原因引起的,根据对中国人民大学网络与教育技术中心所发生服务中断的统计来看,大部分原因是由于软硬件故障,系统错误等原因引起的。针对这种情况,中国人民大学网络与教育技术中心制定了《各系统故障恢复计划》和《各系统数据备份计划》。各系统故障恢复计划概要:各系统故障描述、故障预防措施、处理故障和恢复措施、要求时间、责任人。 4. 维护工作 在保障IT服务持续性中,各个系统的维护工作必不可少,维护工作包括两类:计划维护和非计划维护。 (1)计划维护:即根据预先安排的计划,由时间驱动的维护工作。定期进行各系统故障恢复计划和各系统数据备份计划的评审,评审按计划每年度执行一次。当环境发生变化时,这些变化很容易被忽略,通过评审将帮助检查各系统故障恢复计划和各系统数据备份计划所需要的变更。要求各个系统的责任人必须出席定期评审会。评审将主要关注已经确定的事件,确保这些更新已经或即将整合到各系统故障恢复计划和各系统数据备份计划中。 (2)非计划维护:由事件驱动的维护工作。 因为许多变更是不可预测的。各个系统的负责人将负责在事件发生后向有关人员建议需要更新各系统故障恢复计划和各系统数据备份计划。 5. 灾难发生的演练测试 在工作中很少遇到真正的灾难,所以测试与演练灾难恢复过程是网络与教育中心确定计划,以及想关程序是否可行的方法。它既用来验证风险控制方法的有效性,也用来评估和改进质量。这种方法首先应测试网络与教育中心的关键系统,如:数字人大电子校务系统和网络核心系统。演练测试应明确时间以及每一个关键步骤,最终要在模拟环境中测试完成整个过程。 和其他流程的关联关系 中国人民大学网络与教育技术中心各流程是基于ITIL系统运行,服务持续性流程同其他各流程之间都有着相关的联系: 1. 服务持续性管理流程和服务级别管理流程的关联。 服务级别管理程序中,服务级别协议(SLA)指标应输入到持续性管理程序中。当某个服务项目服务中断,在服务级别协议规定的时间内未能恢复服务,则启动服务持续性管理。服务级别管理是判断是否启动服务持续性程序的依据。 2. 服务持续性管理流程和变更管理流程的关联。 当网络与教育技术中心硬件设备(服务器、交换机)等以及软件发生重大变更时,需重新评估变更对持续性计划的影响,并及时更新持续性计划。 3. 服务持续性管理流程和安全管理流程的关联。 安全管理为预防灾难的发生的,各项服务持续良好运行提供了必要保障, 是持续性管理业务影响分析的依据。 4. 服务持续性管理流程和容量管理的关联。 容量数据是服务持续性计划执行时对IT资源信息的监测与分析。 5. 服务持续性管理流程和配置管理的关联。 应定期保留配置备份数据,用于在恢复系统时使用。持续性管理过程中,对配置信息的变更,应记录到配置管理,用以及时更新配置信息。 IT服务持续性管理的实施,能够降低危机的成本及对业务的影响,改善IT与业务的关系,将风险可能带来的损失降低到最低水平。系统可以提高网络与教育技术中心风险控制工作有效性和风险控制质量,从而大大降低中心业务风险,提高IT服务应急工作水平和抵御各种IT 风险的能力,具有深刻的意义。 参考文献 [1] Gad J Selig著,中治研国际信息技术研究院译《实施IT治理:方法论、模型、全球最佳实践》中国经济出版社。 [2] 学位论文,作者:雷娜。论文题目:《基于项目风险和质量管理的IT服务管理持续性研究》。工程硕士专业学位论文,北京,北京邮电大学,2009年。 |
版权所有:中国教育和科研计算机网网络中心 CERNIC,CERNET,京ICP备15006448号-16,京网文[2017]10376-1180号
关于假冒中国教育网的声明 | 有任何问题与建议请联络:Webmaster@staff.cernet.com