成都铁路学校分享通过对当前中国铁路IT系统环境和管理现状的分析调研,急需建设一套统一的网络和业务系统监控平台,这个平台主要应包括以下几个方面的思想:基于统一、集中的管理体系。统一的数据处理和展现,统一的告警平台。目的是消除各个监控工具之间各自为政、系统管理员在各个界面间频繁切换的情况,将旧的监控工具的数据和事件统一融入到新的监控平台中来,并通过统一的展现界面进行展现、统一的告警平台,将所有告警纳入监控管理监控平台,通过短信、邮件和桌面客户端统一告警。
从业务的角度将传统的技术设备管理整合到基于业务的管理平台上来,不仅能完成对设备监控的需求同时能满足根据业务的组成定位问题根源,定位性能瓶颈,预测业务发展趋势和稳定性。利用现有主机系统的少量资源,实现对各种服务器(Linux、AIX、Windows2003、Windows2008等)监控管理。包括主机硬件、操作系统、文件系统、进程和应用等。主机监控的重点是对操作系统关键指标,如CPU、内存、进程、文件系统等进行全面的监控管理,要求不仅能够在状态改变或性能指标超越门限时生成告警,同时还应该提供实时和历史的性能数据展现,并能够保存历史性能数据,以形成统计分析报表。
各种数据库(Oracle,Sqlserver等)监控管理,包括数据库的重要配置参数以及运行状况的监控。主要关注数据库的关键指标,如SGA使用率、表空间占用情况、锁竞争和使用情况、缓冲区命中率等。其它应用的监控管理。比如IIS、Tomcat、Weblogic监控,重点保证服务的可用性和性能。统一的报告和报表,多台设备性能比较,其它格式导出,柱图、XY坐标、饼图、折线图,定期的运维报告等等。
实现对某种业务的服务水平管理。通过业务服务管理,可以对某种业务在过去一段时间内的运行状况有一个总体的评价和衡量。采用技术成熟、先进,并具有较强的集成性和可扩充性的管理平台。易于使用和维护。统一的中文界面、浏览器管理方式,可以多人同时通过浏览器进行访问和操。解放人力资源,依靠智能化技术化的管理手段,降低故障发生率,降低维护成本,并同时提高维护效率。
通过此运维服务管理系统监控平台的建设,我们最终将会实现以下管理目标:当前中国铁路的5T系统、客车系统、货车系统等多个信息系统采用了多个厂家的网络设备、服务器、中间件、数据库、存储设备、应用系统。因此本监控首先要解决的问题是通过建设全面的监控管理平台将目前各个业务系统中的各种设备、软件、业务应用整合到监控平台中,消除管理对象之间的差别、消除数据采集手段的差别、消除管理软件的差别,对各种不同数据来源数据统一处理、统一展现、统一用户登录、统一权限控制。