中国教育和科研计算机网
EDU首页 |  中国教育 |   高校科技 |   教育信息化 |   CERNET
教育信息化

资讯 | 专题 会议 观点 专栏 访谈 企业 产品 CIO 技术 校园信息化 下一代互联网 IPv6视频课堂

中国教育网 > 教育信息化
您现在的位置: EDU首页 > 教育信息化 > 校园信息化
上海财经大学:搭建一个优良的业务监控系统
http://www.edu.cn   2013-12-20 中国教育网络 作者:宫剑 黄杰 孙晓静

字体选择:【大】 【中】 【小】

  具体思路

  第一步,我们归纳出常见的监控点并进行分类。

  我们通过对以上梳理出来的常见监控内容进行分析,结合CMDB 中的信息得到其对业务系统可用性的影响程度,从而确定一般监控内容需要关注的类型:可用性、安全性、资源利用率、一致性、时效性等,具体如下:

  可用性——可用性和系统组件的失败率相关,系统的失败只有当其导致服务的失效性足以影响到系统用户的需求时才会影响其可用性的指标。对于可用性的监控方式,我们主要根据软件测试的思路,使用各类主动模拟技术,通过脚本主动模拟访问各类CI 项,可以直接取得其具体功能(事务)的响应时间和成功率。

  安全性——国际标准化委员会的对计算机安全的定义是“为数据处理系统和采取的技术的和管理的安全保护,保护计算机硬件、软件、数据不因偶然的或恶意的原因而遭到破坏、更改、显露。”从该定义可知,安全性在中间件、应用实例、业务系统、操作系统等各个层面上都有所体现,而对于操作系统、中间件等偏底层的安全性尤为重要。在《信息系统安全等级保护基本要求》中,针对不同等级的信息系统在技术防护角度上提出了不同的安全要求,包括标识与鉴别、访问控制、密码技术、安全审计、恶意代码防范、备份与恢复等方面的技术。运用监控手段,结合灵活的脚步设计,可以对安全设备的运行、防护措施的落实、备份恢复的有效性等多方面工作进行实时监控。

  资源利用率——资源使用率指对软硬件等资源的负载情况,一般包括CPU 使用率、磁盘空间使用率、系统平均负载、内存使用率、开机时间、I/O 以及网络负载等。资源利用率一般会直接与应用系统的性能有关,对用户的体验造成影响。

  一致性——这里的一致性主要是指逻辑上应该相同的内容,其物理上也应该是相同的。以负载均衡环境下的多个应用实例而言,只有保证各个实例之间的一致性,应用实例才可以对外提供一致的应用服务。其他的例子还包括不同介质上保存的相同备份内容,其文件大小及md5 也应该是相同的。

  时效性——响应时间主要指数据库和业务服务的响应时间,数据库的响应时间可以通过监控数据库的关键指标来获得,业务服务的响应时间可以通过模拟浏览器访问的行为,从而获取业务服务的响应时间。此外,时效性也包括其他CI 项的类似倒计时提醒,如针对维护合同的到期日期、关键用户账户的到期日期等,通过扫描程序,定时扫描合同日期、重要系统的管理员及其它高级权限的用户账号等,不同类型账号的有效期、修改密码的要求设置不一样,通过对比账号的有效期,从而完成倒计时提醒功能。

  第二步,针对上述整理出的监控内容分类,进一步返回到CMDB 中,对每一层面、每一类型的CI项分别针对上述监控点类型进行筛查,并建立具体的对应矩阵,尽可能减少监控点的遗漏。监控矩阵示例如表1。

  表1 中,CI 项一列为CMDB 中的每一个配置项,矩阵中的数字则代表该CI 项所对应监控类型对业务可用性可能造成的影响大小,5为最大,0 为最小。具体针对矩阵中每一个非0 值,都需要制定出对应的checklist检查表,对具体监控内容及监控方法进行描述,为监控的具体实施提供参考依据。最后形成一个CMDB 中所有CI 项对应的监控点检查表矩阵,检查表的样式如下:

  CI 类型:×××

  CI 名称:×××

  监控类型: 可用性—— 检查点1:×××;监控方式:×××;

  检查点2:×××; 监控方式:×××。

  第三步,结合CI 变更管理流程对监控项同时进行变更。

  基于CMDB 的变更管理是ITIL 管理的核心,CI 数据的时效性和准确性是CMDB 成功实施的重要标准。如果一名运维工程师在做处理故障前,获得了不准确的CI 信息,从而做出错误的诊断结论,后果不堪设想。这样就要求我们要规范的变更管理流程,使用标准的模版记录、跟踪那些原始信息,并与ITIL 的流程紧密结合,同时需要定期审计。

  在进行CI 项的变更过程中,由于监控系统紧密依赖于CMDB,因此监控项也需要做出相应的变更。也就是说,在变更管理流程中,需要在某个步骤加入对与CI相关联的所有监控项也要进行变更,具体可从管理和技术两个角度进行实现。

  从管理角度,在变更的某个环节加入监控项的审核,由运维人员完成此类工作;从技术角度,还可以使用监控程序对CMDB 与监控项进行一致性监控,也就是通过监控系统来监控自身的业务是否存在风险,比方说通过监控CMDB 的新增、修改的内容和最后修改时间,与监控检查点的内容、最后修改时间进行比对,从而在变更第一时间发现哪些CI项缺少监控点,哪些CI 项变更后但其监控点没有变更,这样完成对CI 变更后内容的监控。

页面功能 【打印】 【关闭】 【我有话说

MOOC风暴来袭

版权所有:中国教育和科研计算机网网络中心 CERNIC,CERNET,京ICP备15006448号-16,京网文[2017]10376-1180号

关于假冒中国教育网的声明 | 有任何问题与建议请联络:Webmaster@staff.cernet.com