IT应急预案

. 第九章 网络与服务器系统应急预案 1.紧急事件处理流程 员工在工作中发现网络或系统故障后上报到财务经理,财务经理下派任务到IT管理员处由IT管理员到达现场确认问题级别,问题分为一般和严重两种,一般问题不需上报;严重问题需上报公司“信息化管理委员会”启动紧急预案,由信息化管理委员会组织协调公司IT和第三方维护单位处理故障问题。(如图) 2.IT人员处理具体实施细则 2.1、应急规划原则 应急规划关系到计算机系统使用的持续性,因此将重点放在防止 IT 服务中断,以及中断发生后的系统恢复方面。系统中断的范围可以从应用程序、系统或网络故障,一直到应用场所的完全消失。

应急规划需考虑的可能出现的灾难包括 火灾/爆炸/破坏/被窃 水灾/自然灾害/虫灾/建筑物毁坏 行业行动/意外损坏 设备丢失或故障 - 计算、网络或环境控件 软件故障 2.2、数据丢失或损坏 如设备故障或火灾。通过实施一些对策(如备用网络链接设备),能够排除系统设计中脆弱部分造成的威胁,从而限制威胁对信息服务所造成的影响。在出现重大威胁的情况下,用于保证系统持续性的应急规划必须提供在备用位置完整恢复服务的设施。

2.3、电力故障 机房的正常运转在某些方面很大程度地取决于其他服务。电力故障的应急处理机房主服务器的供电是非常重要的,考虑配备UPS集中供电,可以保证机房断电后正常使用2小时。关键科室的电脑配备了后备式的UPS,可以保证15分钟的延迟使用。由后勤保障部保证服务的恢复即后备发电,协调保证关键计算机的供电。

2.4、软件故障 应用程序级别故障应有24小时的电话支持。

I.服务器 A.服务器端软件无法使用,查看任务管理器和事件日志,记录出错的信息并判断. B.关闭相应的服务器进程,并重新启动该服务器进程. C.查看数据库连接是否正确. D.查看数据库服务器是否运行正常. 2.5、操作系统级别故障 I.服务器 A.经判断为服务器操作系统层面的故障后,在采取任何措施之前,应该备份故障服务器上所有相关数据,并确定通过备份数据可以至少把服务器恢复到故障发生时的初始状态即保护现场,在确定任何一步操作有回复的途径之前,不应该进行该操作. B.情况严重时启用备用服务器以系统服务不中断. C.查看任务管理器,记录资源使用状况以及各个进程详细情况,以备后续判断. D.根据故障原因可能采取的部分恢复措施有 a.停止或者暂时停止部分系统服务以改善性能. b.关闭死锁的进程,再重新启动这些进程. c.备份注册表后,对注册表进行微调.(慎用) d.删除部分引起故障的应用. e.在系统空闲时期重新启动服务器. f.联系第三方厂家现场或远程支持 2.6、主数据库故障 2.6.1、视故障严重程度,启用备用服务器,提供应急的数据库服务. 2.6.2、备份所有的数据库文件,在确定每步操作可以有回复的途径之前,不宜进行该操作. 2.6.3、查看操作系统的系统服务中的与SQL SERVER相关的数据库服务,监听服务等是否正确启动,并重新启动这些服务. 2.6.4、以上措施无效,重新启动数据库. 2.6.5、如果为数据库数据文件损坏,则对使用数据库备份文件对数据进行回复操作. 2.6.6、以上措施无效,重建数据库, 2.6.7、以上措施无效,备份数据库文件,删除数据库,重建数据库,然后导入备份的数据库文件. 2.6.8、联系售后服务商进行售后服务. 2.7、硬件故障 服务器 2.7.1、马上使用备用服务器,保证应用系统能够正常服务。

2.7.2、联系供应商进行售后服务。

2.8、网络故障 特指由于布线系统方面线路断离,接触不良,网络设备等故障而引起的公司内局域网中断 网络单点故障的应急处理有一定的线路备份,特别是关键部位设置应急线路,必要时启动备份线路 A线路断离 a.更换跳线 b.更换信息点 B网络设备故障 a.更换备用网络设备,保证日常工作的进行。

b.联系供应商更换或维修。

部分内容来源于网络,有侵权请联系删除