信息系统运维管理制度

2023-05-10

制度是工作的抓手,也是长效机制形成的保障。那么你真的知道如何制定制度吗?以下是小编的收集整理的《信息系统运维管理制度》相关资料,欢迎阅读!

第一篇:信息系统运维管理制度

信息系统运维管理制度

为了规范公司信息系统的管理维护,确保系统硬、软件稳定、安全运行,结合公司实际,制定本制度。制度包括信息机房管理、服务器管理、信息系统应用管理、信息系统变更管理、信息系统应用控制。

一、信息机房管理

1、硬件配备及巡检

1.1、信息机房按规定配备防静电地板、UPS、恒温设备、温湿度感应器、消防设备、防鼠设施等相关基础设施。

1.2、机房管理人员定期(如每月或每季度)对机房硬件设备设施进行巡检,以保证其有效性。

1.3、机房应建立相关的出入登记、设备巡检、重大故障等记录,并认真填写。

2、出入管理

2.1、严禁非机房工作人员进入机房,特殊情况需领导批准,并认真填写登记表后方可进入。

2.2、进入机房人员应遵守机房管理制度,更换专用工作鞋。 2.

3、进入机房人员不得携带任何易燃、易爆、腐蚀性、强电磁、辐射性、流体物质等对设备正常运行构成威胁的物品。

3、安全管理

3.1、操作人员随时监控中心设备运行状况,发现异常情况应立即按照应急预案规程进行操作,并及时上报和详细记录。

3.2、未经批准,不得在机房设备上随意编写、修改、更换各类软件系统及更改设备参数配置;

3.3、软件系统的维护、增删、配置的更改,必须按规定详细记入相关记录,并对各类记录和档案整理存档。

3.4、机房工作人员应恪守保密制度,不得擅自泄露信息资料与数据。

3.5、机房内严禁吸烟、喝水、吃食物、嬉戏和进行剧烈运动,保持机房安静。

3.6、严禁在机房计算机设备上做与工作无关的事情(如聊天、玩游戏),对外来存储设备(如U盘、移动硬盘等),做到先杀病毒后使用。

3.7、机房严禁乱拉接电源,应不定期对机房内设置的消防器材、烟雾报警、恒温设备进行检查,保障机房安全。

4、操作管理

4.1、机房的工作人员不得擅自脱岗,遇特殊情况离开时,需经机房负责人同意方可离开。

4.2、机房工作人员在有公务离开岗位时,必须关闭显示器;离开岗位1小时以上,必须关闭主机及供电电源。

4.3、每周对机房环境进行清洁,以保持机房整洁;每季度进行一次大清扫,对机器设备检查与除尘。 4.

4、严格做好各种数据、文件的备份工作。服务器数据库要定期进行双备份,并严格实行异地存放、专人保管。所有重要文档定期整理装订,专人保管,以备后查。

5、运行管理

5.1、机房的各类计算机设备,未经负责人批准,不得随意编写、修改、更换各类软件系统及更改设备参数配置。

5.2、各类软件系统的维护、增删、配置的更改,各类硬件设备的添加、更换必需经负责人书面批准后方可进行;必须按规定进行详细登记和记录,对各类软件、现场资料、档案整理存档。

5.3、为确保数据的安全保密,对各业务单位、业务部门等送交的数据及处理后的数据都必须按有关规定履行交接登记手续。

5.4、部门负责人应定期与不定期对制度的执行情况进行检查,督促各项制度的落实,并作为人员考核之依据。

二、服务器管理

1、服务器管理

1.1、服务器、路由器和交换机以及通信设备是信息网络的关键设备,须放置在机房内,不得自行配置或更换,更不能挪作它用。

1.2、服务器机房要保持清洁、卫生,并由专人负责管理和维护除系统维修和维护时间外,要保障服务器24小时正常运行。

1.2、不得在服务器上使用不安全的软件、U盘和移动存贮设备,使用上述设备前一定要先做好病毒检测。 1.

3、不得利用服务器从事工作以外的事情,无工作需要不得擅自拆卸服务器零部件,严禁更换服务器配套设备。

1.4、不得擅自删除、移动、更改服务器数据;不得故意破坏服务器系统;不得擅自修改服务器系统时间。

1.5、定期进行服务器系统扫描,及时关闭可疑的端口与服务,经常查看服务器运行日志,检查服务器磁盘空间(或其它存储设备)的使用情况,及时发现服务器异常运行情况并做好记录。

1.6、管理员对服务器管理员账户与口令应严格保密、定期修改,以保证系统安全,防止对系统的非法入侵。

1.7、对服务器数据实施严格的安全与保密管理,防止系统数据的泄露、丢失及破坏。

1.8、及时处理服务器软硬软件系统运行中出现的各种错误,对所有工作中出现的大小故障均要作详细的登记,包括故障时间,故障现象、处理方法和结果。

1.9、双休日、节假日,要安排专人值班,如发现问题及时解决,并做好记录处理。

2、服务器病毒防范制度

2.1、服务器管理人员应有较强的病毒防范意识,定期进行病毒检测,发现病毒立即处理。

2.2、未经上级管理人员许可,不得在服务器上安装新软件,若确需要安装,安装前应进行病毒例行检测。

2.3、经远程通信传送的程序或数据,必须经过检测确认无病毒后方可使用。 2.

4、及时关注IT行业病毒防治情况和提示,根据行业提示调节服务器安全参数,避免服务器被侵袭。

2.5、建立病毒防护体系。在系统执行拷贝、运行等操作前,检测文件是否感染病毒,发现病毒自动清除或由管理员选择处理。

2.6、定期实施静态杀毒,对服务器统一杀毒处理。发现系统遭到严重病毒攻击并形成一定破坏时,应立即向单位负责人报告,同时向相关单位反映情况,并尽快采取有效措施组织抢救,最大限度控制受损面。

3、数据备份与检查

3.1、服务器的数据库必须做好备份,定期(如每周或每月)做好日志文件的备份。服务器内的重要数据做好不同介质存放,确保系统一旦发生故障时能够快速恢复。

3.2、每月定期检查备份数据,如有损坏,及时重新备份。 3.

3、备份的数据必须指定专人负责保管,保管地点应有防火、防热、防潮、防盗等设施。

3.4、建立双备份制度,对重要资料除在服务器贮存外,还应拷贝到其他介质上,以防遭病毒破坏而遗失。

三、信息系统应用管理

1、应用管理

1.1、系统投入使用前,依据公司的信息应用系统管理原则,结合该应用系统的功能需求和技术特性,业务部门组织系统使用部门共同制定该系统的应用方案。

1.2、系统出现问题时由资产归属单位自行负责管理、维修和维护;出现自身无法解决的问题时,将异常现象、发生时间和可能的原因作详细记录,并立即提交给上级部门,由专业人员对异常情况进行分析和处理。

1.3、系统账号及权限由使用单位进行管理,确需技术支持时,上级部门可对使用单位进行指导。

1.4、权限中的账号中的信息、数据按规定划分,用户可根据其账号的权限进行阅读、使用。使用单位根据用户的职责权限编发账号,每个用户对应唯一的账号,禁止使用他人账号,否则造成的后果由使用者和账号泄露者共同承担。

1.5、系统中的管理员账号和权限,经使用单位提请信息部门授权后,方可使用。

1.6、信息系统用户离职、调动时,其使用单位必须向信息部门出具离职、调动申请,经审核批准后,由系统管理员及时对其账号进行撤销或修改。

1.7、系统使用的相关资料应有使用单位进行保存,在信息部门进行备案。

2、应急处理

2.1、在信息系统准备阶段,由承建商、使用单位、信息部门三方共同编制紧急预案,并定期演练;信息系统发生紧急情况时,由信息部门依据紧急预案,向有关部门和公司领导及时通报故障情况。

2.2、系统发生故障时,由信息部门依据紧急预案,组织技术人员进行抢修,最大限度的降低故障带来的损失。

2.3、应急处理结束后,信息部门应认真总结应急事件发生的原因、处理过程和经验教训,提出整改措施和方案。

2.4、信息系统应急处理详情见附表二《信息安全管理制度》中的信息安全风险应急预案。

3、数据备份与恢复

3.1每周对关键业务数据进行备份,确保业务数据完整、真实、准确地转储到备份介质上,备份介质需标明备份日期和备份内容,严格控制知悉此备份的人数,备份的数据必须由专人负责保管。

3.2对备份数据进行登记管理,备份可采用磁盘、移动硬盘、U盘等存储介质。

3.3、涉密文件和资料备份应严加控制。未经许可严禁私自复制、转储和借阅。对存储涉密信息的磁介质应当根据有关规定确定密级及保密期限,并视同纸制文件,分密级管理,严格借阅、使用、保管及销毁制度。

3.4、新系统上线运行时必须做好系统的完全备份,根据业务频率和数据的重要程度做好增量备份。

3.5、技术人员每周将备份上传至信息部门,信息部门管理人员对备份执行情况进行检查,并做好相关记录。

3.6、技术人员定期对备份数据进行恢复验证,确保备份数据的可靠性,并做好相关记录。

四、信息系统变更管理 4.1、信息系统的更新、升级及重大变更需上报机电管理部审批,审批完成后方可执行;若需中断业务时需向公司汇报批准后执行。财务、全面预算等重要保密系统需经财务系统主管部门审核批准后方可进行更改,操作过程必须详细记录。

4.2、信息系统变更的实施需报公司审核批准后执行,变更实施需由信息部门组织实施,系统管理人员负责具体操作,变更过程必须详细记录并保存。

4.3、当信息系统出现故障、异常情形时,系统管理人员应立即上报业务主管部门,由业务主管部门启动“信息系统突发事件应急预案”,并联合信息部门负责组织技术人员进行故障处理。

4.4、信息系统的新系统接入或旧系统删除操作需经业务主管部门批准后方可执行。

4.5、信息系统的变更必须严格按照操作流程进行,系统管理人员不得擅自进行软件的删除、修改等操作,不得擅自升级、改变软件版本,不得擅自改变软件系统的环境配置。

4.6、系统变更程序必须遵循与新系统开发项目同样的验证和测试程序,测试通过后方可进行变更,必要时还要进行额外测试。

4.7、各信息系统相关设备资料(系统驱动、设备说明书、系统授权书等)要按照相关技术档案存储制度保存,以备查看。

4.8、对信息系统的备品备件必须详细记录,保证数量及型号满足系统应急,如有缺失必须及时进行补充和更新,并做好标签,明确功能。

五、信息系统应用控制: 5.1、针对手工录入、批量导入、接受其他系统数据等不同数据输入方式,系统将自动对数据的准确性、有效性和完整性进行检查和校验。

5.2、系统管理人员应严格按照信息安全保密制度做好信息系统安全工作,各信息系统的口令、密码要求严格保密,严禁擅自更改或泄露系统访问授权。

5.3、强化输出资料分发控制,确保资料只能分发给具有相应权限的用户。

第二篇:信息化网络系统 运维管理制度

第一章 总则

第一条 为规范集团信息化网络系统的运行维护管理工作,确保信息化网络系统的安全、可靠地运行,切实提高生产效率和服务质量,使信息化网络更好地服务于生产运营和管理,特制定本管理制度。

第二条 内部市场化管理信息系统的维护内容分为机房(专指办公楼107机房)环境维护、网络设备维护、配套服务器维护三部分:

1、机房环境指保证计算机系统正常稳定运行的基础设施,包含机房建筑、电力供应、空气调节、灰尘过滤、静电防护、消防设施、维护工具等子系统。

2、网络设备维护指保证网络系统正常运行的网络设备,包括联网所需的交换机、路由器、防火墙等网络设备和局域网内连接网络设备的网线、光纤线路等。

3、配套服务器维护指为网络系统提供服务的应用服务器,包括DNS服务器、网络管理系统服务器、VPN设备、流量控制设备等。

第三条 运行维护管理的基本任务:

1、进行系统的日常运行和维护管理,监控系统运行状态,保证系统各项运行指标符合相关规定;

第 1 页 共 6 页

2、迅速而准确地定位和排除各类故障,保证系统正常运行,确保所承载的各类应用和业务正常;

3、进行系统安全管理,保证系统的运行安全和信息的完整、准确;

4、在保证网络系统运行质量的情况下,提高维护效率,降低维护成本。

第二章 运行维护组织及职责分工

第四条 集团信息化网络系统运维管理工作由总工程师负责组织协调,其计算机硬件平台、配套网络、基础软件以及应用软件的日常运维工作由负责组织和实施。具体分工如下:

分管领导: 系统管理责任人: 系统技术管理人员:

第五条 系统管理责任人须定期(每月一次)对数据备份日志、巡检日志、问题跟踪处理日志等进行确认并审核,发现问题及时整改补救。

第六条 系统管理责任人须定期(每月一次)召集系统相关运维人员对系统最近的运维情况进行分析总结,对系统运维过程中发现问题,积极协调解决。

第七条 系统技术管理人员在系统管理责任人的统一领导和指挥下,对其机房环境、网络设备、配套服务器进行日常运维管理工作。

第 2 页 共 6 页

第三章 故障处理流程

第十二条 根据故障的影响范围及持续时间等因素,将故障分为三级。具体参见《集团信息化网络系统应急预案》。

第十三条 系统出现故障时,系统技术管理人员应立即行动,初步查明原因(电力、线路、设备、服务等),根据事件的范围、影响和紧急程度启动相应等级的应急预案,并向主管领导汇报,同时按照日常演练迅速处理故障,尽快恢复系统运行;若无法独立解决问题,及时汇报,立即联系厂家相关维护工程师,远程协助解决或者到场现场解决;在对系统完成修复并全面测试通过后,正式恢复启用系统,同时将情况向主管领导汇报。

第四章 系统变更管理

第十四条 系统变更包括硬件扩容、冗余改造、版本升级、路由更改、VLAN划分等工作以及网络结构、拓扑的改变等。

第十五条 系统技术管理人员应保证在线系统的软件版本及硬件设备的稳定,未经过上级领导批准,不得私自对在线系统软件版本及硬件设备进行任何变更及调整。

第十六条 变更必须上级领导批准后组织实施,并制定详细的变更方案和应急预案。

第十七条 系统变更前,必须先设计好变更方案和应急预案且必须在夜间进行。变更结束并验证通过后,以书面形式向上级领导汇报结果,并完成相关文档资料的更新和总结工作。

第 3 页 共 6 页

第七章 系统日常管理

第十八条 系统技术管理人员负责每天对系统相关的网络设备、配套服务器进行检查,具体检查内容如下: 网络设备检查:登陆网络管理系统对网络设备的运行状态、上行链路流量进行检查并登记每日检查报表。

配套服务器检查:登录服务器后,查看操作系统、服务和应用软件等软件的运行状态。

第十九条 系统技术管理人员负责每周负责对系统的硬件设备进行检查,检查完后填写每周检查报表。具体检查内容如下: 网络设备检查:到二楼机房和107机房实地查看网络设备的工作状态,指示灯状态,端口工作状态、线缆是否松动、标签是否完好,并清洁设备卫生。

配套服务器检查:检查服务器的硬件状态,指示灯状态,对服务器进行安全检查并杀毒。

机房环境检查:观察设备的环境温度、湿度以及清洁度等情况,观察UPS的液晶面板的显示情况,记录系统设备环境和指示灯的情况;

第二十条 系统技术管理人员负责每月对办公楼、综合楼、高层和43号楼各楼层设备间的网络设备进行检查,检查完后填写每月检查报表。具体检查内容如下:

网络设备检查:查看网络设备的工作状态,指示灯状态,端口工作状态、光收发状态、线缆是否松动、标签是否完好,并清洁

第 4 页 共 6 页 设备卫生。

机房环境检查:观察设备间的环境温度、湿度等情况,对机房卫生进行清洁,记录系统设备环境和指示灯的情况;

第二十一条 系统技术管理人员负责每季度对各小站机房信息化网络的硬件设备进行巡检,检查完后填写巡检报表。具体巡检内容如下: 网络设备巡检:交换机和光收发指示灯是否正常,温度是否高温,网线头是否松动,标签是否脱落,电源线是否正常连接等,并对设备进行清洁。

第二十二条 系统巡检过程中,如发现系统故障及时处理并汇报相关领导,并做好故障处理记录和分析总结工作。

第八章 技术档案和资料管理

第二十三条 系统技术管理人员负责技术档案和资料的管理,应建立健全必要的技术资料和原始记录,包括但不限于:

1、系统结构图及相关技术资料;

2、网络连接图和相关配置资料;

3、各类软硬件设备配置清单;

4、设备或系统使用手册、维护手册等资料;

5、上述资料的变更记录。

第二十四条 系统技术管理人员负责运行记录的管理:

第 5 页 共 6 页

1、维护作业计划和使用的各种规章制度;

2、系统运行记录和巡检记录;

3、故障处理、设备检修及返修等记录;

4、软、硬件设备变更和系统参数变更记录。

第九章 备份及日志管理

第二十五条 设备配置每季度备份一次,如果对配置文件做了修改,需要在修改完成后立即另外备份一份,备份完成后上传到备份服务器上做双备份。

第十章 安全保密原则

第二十六条 内网电脑需要做公网映射服务的,必须经主管领导批准后方为其开放。

第二十七条 系统技术管理人员未经批准不得擅自抄录、复制配置资料、技术档案、内部资料不得泄露。

第二十八条 系统技术管理人员对重要网络设备如出口路由器、防火墙、核心交换机、汇聚交换机等的密码管理应严格遵循如下要求:每90天至少更换一次密码,密码长度不小于8位、且包含数字和字母等字符,不得使用最近一次使用过的密码等,不得随意记录在笔记本和电脑中。

第 6 页 共 6 页

第三篇:系统运维管理-计算机信息系统运营和维护管理规范

信息服务管理规范

计算机信息系统运营和维护管理规范

前言

《信息服务管理规范》依据《ISO/IEC20000:2005“信息技术——服务管理”》标准,及其它国家和行业相关法律、法规制订。本规范为《信息服务资费标准》的引导性文件。 《信息服务管理规范》分为10部分:

第一部分:总则

第二部分:计算机信息系统集成管理规范 第三部分:计算机信息系统运营和维护管理规范 第四部分:软件服务管理规范 第五部分:数据加工和处理管理规范 第六部分:内容和增值服务管理规范 第七部分:数据库服务管理规范 第八部分:电子商务服务管理规范 第九部分:信息化工程监理规范 第十部分:其它专业类服务管理规范

目录

前言 ---------------------------- 2 目录 ---------------------------- 3 第三部分计算机信息系统运营和维护管理规范 ---- 6

1 适用范围 ------------ 6 2 规范性引用文件 --- 6 3 定义和术语 --------- 6

3.1 服务台 ------- 6 3.2 事件 ---------- 7 3.3 问题 ---------- 7 3.4 突发事件 ---- 7 4 要求 ------------------ 7 5 运营和维护服务类型 ---------------------------- 7

5.1 基础服务 ---- 7 5.2 性能优化服务 ---- 8 5.3 增值服务 ---------- 8 6. 运营和维护服务内容 --------------------------- 8

6.1 基础服务内容 ----------------------------- 8 6.2 性能优化服务内容 ---------------------- 12

7 服务台管理 -------------- 14

7.1 服务台功能 14

7.2 服务台流程 15 7.3 优先级 ------ 15 8 运营和维护管理体系 --------------------------- 16 9. 运营管理----------- 17

9.1 运营管理目标 ---------------------------- 17 9.2 需求分析 --- 17 9.3 运营计划 --- 17 9.4 过程管理 --- 17 9.5 协调与沟通 17 9.6 服务交付 --- 18 10 维护管理 ---------- 18

10.1 维护管理目标 -------------------------- 18 10.2 需求分析19 10.4 沟通与协调 ----------------------------- 19 10.5 问题管理20 10.7 维护确认21 11 突发事件管理 ---- 21

11.1 评估与分类 ----------------------------- 21 11.2 突发事件处理 -------------------------- 21

12 管理机制 ---------- 21

第三部分计算机信息系统运营和维护管理规范

1 适用范围

本规范规定了提供计算机信息系统运营和维护服务的各类组织实施计算机信息系统运营和维护服务管理的范围、目的、性质和原则。

本规范适用于计算机信息系统运营和维护服务活动涉及的各类组织。

2 规范性引用文件

下列文件中的条款通过本规范的引用而成为本规范的条款。凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本规范,然而,鼓励根据本规范达成协议的各方研究是否可使用这些文件的最新版本。凡是不注日期的引用文件,其最新版本适用于本规范。

《信息服务管理规范 第一部分:总则》

3 定义和术语

《信息服务管理规范 第一部分:总则》确立的以及下列定义和术语适用于本部分。

3.1 服务台

信息服务单位设置的与用户之间的接入点,负责记录、分解、监控运营维护中的事件;受理投诉、意见、建议;与用户沟通,提出事件的处理和解决方案及意见反馈等。

3.2 事件

计算机信息系统运营过程中发生的问题、故障等情况。

3.3 问题

影响计算机信息系统运营的各种需要解决的疑难、缺陷等。

3.4 突发事件

突然发生的、未曾预防的、需要立即处理的紧急事件、灾害事故等。

4 要求

本部分遵循《信息服务管理规范 第一部分:总则》的一般原则和要求,重点描述计算机信息系统运营和维护服务类型、服务内容以及运营和维护管理等。

计算机信息系统运营和维护服务的一般原则和要求,参照《信息服务管理规范 第一部分:总则》执行。

在计算机信息系统运营和维护服务中,应同时使用《信息服务管理规范 第一部分:总则》和本部分。

在计算机信息系统运营和维护服务中,应根据《信息服务管理规范 第一部分:总则》确立的原则和要求,制订服务等级协议,划分服务等级。

5 运营和维护服务类型 5.1 基础服务

确保计算机信息系统安全稳定运营,必须提供的基础性的保障和维护工作。

5.2 性能优化服务

计算机信息系统在运营过程中,各项应用(硬件基础平台、系统平台、存储平台、应用系统平台、安全平台等)、各项业务的性能、效能的优化、整合、评估等服务。

5.3 增值服务

保证计算机信息系统运营的高效能、高效益,最大限度的保护并延长已有投资,在原有基础上实施进一步的应用拓展业务。

6. 运营和维护服务内容 6.1 基础服务内容

6.1.1 物理环境管理和维护

Ⅰ.机房管理和维护

为保证机房内所有设备的安全、稳定、无故障运行,监控机房的环境、监测并定期检查电源、通风、接地等所有机房设施的工作状态,发现并报告问题和提出变更建议。 a)电源管理:将电源有效分配到系统中不同的设备组件。应考虑电源设备参数对设备的影响,如过压、过流、浪涌、短路等。

b)等电位管理:应设置配电系统、各类电子设备及附属设施、防雷等的等电位体,并考虑静电防护、感应雷电可能形成的电磁脉冲和过电压的干扰和毁坏等。

c)设备管理:计算机信息系统设备的日常运行和管理、可靠性评价。 d)环境管理:应考虑机房内通风、温度、湿度、灰尘、灯光等的配置;考虑机柜放置与冷却效率和制冷单元热点的关系;以及可能因功能扩大引起的冷却

效率问题等。 e)灾害预防:应考虑物理和自然灾害发生的可能性,制定应急预案。

Ⅱ.其它管理和维护

a)布线系统管理和维护:监控、诊断、分析设备间、弱电井等区域配线设备、线缆、信息插座等设施,及网络通信线路的工作状态和可能的故障状态,发现并报告问题,提出维护建议,保证系统运行的高可靠性和维护的高效率。

b)监控系统管理和维护:监控、诊断、分析门禁系统、各类监控设备等的运行状态、参数变化、提示信息等,发现并报告问题,及时变更、维护,保证监控系统的可靠性。

6.1.2 网络基础设施管理和维护

为保证路由设备、网络交换设备等网络基础设施的安全性、可靠性、可用性和可扩展性,保证网络结构的优化,定期评估网络基础平台的性能,制定故障维护预案,及时消除可能的故障隐患,制定应急预案,保证网络基础平台的高可靠性、高可用性。

6.1.3 数据存储设施

为保证数据存储设施,如服务器设备、集群系统、存储阵列、存储网络等,以及支撑数据存储设施运行的软件平台的安全性、可靠性和可用性,保证存储数据的安全,定期评估存储设施及软件平台的性能,确认数据存储的安全等级,制定故障应急预案,及时消

除故障隐患,保障信息系统的安全、稳定、持续运行。

6.1.4 系统平台管理

为保证操作系统、数据库系统、中间件、其它支撑系统应用的软件系统及网络协议等的安全性、可靠性和可用性;定期评估系统平台的性能,制定系统故障处理应急预案,及时消除故障隐患,保障信息系统的安全、稳定、持续运行。

6.1.5 应用系统管理和维护

保证在系统平台上运行的各类应用软件系统的安全性、可靠性和可用性,定期评估应用软件系统的性能、功能缺陷、用户满意度等,及时或与开发商沟通消除应用系统可能存在的安全隐患和威胁、根据需求更新或变更系统功能。

6.1.6 数据管理和维护

数据管理是系统应用的核心。为保证数据存储、数据访问、数据通信、数据交换的安全,定期评估数据的完整性、安全性、可靠性;制定备份、冗灾策略和数据恢复策略,消除可能存在的安全隐患和威胁。

Ⅰ.数据安全性管理和维护

a)安全评估。应对数据的完整性、可靠性、可用性和保密性等要素进行评估,制定数据管理和数据恢复策略,保证数据的安全。

b)数据访问控制:应制定数据访问控制策略、访问权限控制策略、非授权访问处理策略,防止未经授权的数据访问、修改、移动、删除、毁损等。

c)数据存储与冗灾:应制定数据存储、数据冗灾策略,评估数据存储的安全性,保证数据存储的完整性、可靠性;制定数据存储事件处理预案;

d)数据通信安全:应评估数据通信的安全性,制定数据通信的安全策略,保证数据的完整性、可靠性、保密性和不可抵赖性;制定数据通信应急处理预案;

Ⅱ.媒介安全性管理和维护

应制定媒介管理、权限策略,制定媒介泄露的处理策略,明确责任,保证数据保管的安全。

6.1.7 安全管理和维护

保证物理环境和系统运行的安全,物理环境安全包括机房监控、门禁系统、灾害预防、等电位系统、消防系统等等;系统运行安全包括风险评估、安全策略、安全机制、安全级别、病毒防护、补丁管理等等。定期检查和评估可能的安全隐患、缺陷和威胁,制定安全恢复预案。

Ⅰ.风险评估

应对系统的安全威胁、脆弱性、漏洞进行评估,对安全管理进行评估,制定风险应对策略和风险处理机制,及时消除或弱化风险,并将残余风险控制在可控范围内。 Ⅱ.安全策略

应制定物理环境、基础平台、数据、应用软件、事件管理等的信息安全策略,实行信息安全教育,明确责任,采取相应的安全措施,实施安全策略的综合管理。

Ⅲ.安全级别

应根据GB17859-1999《计算机信息系统安全保护等级划分准则》,评估安全等级,定义安全级别。

Ⅳ.安全机制

定义不同的安全机制,包括加密机制、访问控制机制、身份认证机制、数据完整性机制、

数字签名机制等,制定事件处理流程和机制,避免安全威胁和隐患。 Ⅴ.数据交换

应规划建设数据安全交换平台,保证内、外网络之间数据交换的安全。应制定数据安全交换、交换过程,保证数据的完整性、可靠性、安全性策略;制定数据交换事件处理预案,评估数据交换事件的影响。

Ⅵ. 病毒防护

应制定病毒防护和恢复策略,定期评估病毒影响,采取相应的病毒防护措施;制定病毒事件处理预案。

Ⅶ.个人信息保护

应建立个人信息保护管理机制,制定个人信息保护策略,对工作人员进行个人信息保护宣传和教育。制定个人信息保护事件处理预案。

6.1.8 子网管理和维护

子网是构成系统的要素。定期评估子网的安全性、可靠性、可用性,消除可能存在的故障和安全隐患及对系统的威胁。

6.1.9 桌面管理

个人计算机终端及环境的可靠性、可用性、安全性管理。 6.1.10 操作管理

日常操作的规范化和标准化。

6.2 性能优化服务内容

6.2.1 系统平台性能评估

评估系统整体架构的合理性、安全性、可靠性、可用性、可扩展性,以及系统健壮性评估等。

6.2.2 应用系统性能评估

评估支撑软件、应用软件及其它应用系统性能的安全性、可靠性、可用性,和功能缺陷等。

6.2.3 数据存储和通信安全评估

评估数据的完整性、保密性、不可抵赖性;数据通信的安全策略;访问控制策略,以及、安全隐患评估、数据交换安全性评估等。

6.2.4 系统整体安全性能评估

风险评估及应对策略、系统脆弱性检测、非传统安全隐患评估及应对策略等。

6.2.5 系统安全平台性能评估

评估安全防护体系架构的合理性、安全防护体系自身的安全性、可靠性、可用性及存在的风险;安全管理体系的合理性、可用性等。

6.2.6 业务整合

评估用户的业务系统与信息技术整合的现状和改进措施。

6.3.1 规划管理

主要包括:信息系统总体发展架构;信息系统中长期建设、应用、发展规划;资源整合和规划;IT治理模式;IT服务规划;标准建设等。

6.3.2 可用性管理

优化、设计、提高系统基础架构(包括硬件基础平台、系统平台、安全平台、数据管理平台等)的可用性、可靠性,降低系统TCO值。

6.3.3 核心应用管理

计算机信息系统中核心技术、高端技术的应用、部署、管理。

6.3.4 安全管理

系统安全的深层分析;安全防护体系、安全管理体系的优化、设计等。

6.3.5 投资保护

信息系统建设的投资分析、TCO分析,根据规划管理,制定投资策略等。

6.3.6 系统运营策略和应用拓展

分析系统需求影响和运营效能,制定获得最大效能的系统运营策略、分析系统潜在的增值服务的可能性等。

7 服务台管理

计算机信息系统运营和维护服务支持,由服务台根据服务内容实施。

7.1 服务台功能

服务台依据用户需求、服务水平管理定义、服务能力定义、服务类型等,实施运营和维护的日常管理。主要功能应包括:

a)响应用户服务请求; b)事件处理的管理和协调; c)服务相关信息的发布; d)与用户的沟通、协调;

e)意见反馈。

7.2 服务台流程

a)服务优先级确定; b)事件识别、分类; c)事件解决方案和处理; d)事件状态追踪和沟通; e)事件处理结果确认; f)用户满意度评估; g)意见反馈。

服务台的服务水平,应根据以下三项评价: a)可用性(事件响应、事件处理、人员素质等); b)技术能力(事件处理的服务能力); c)用户满意度(事件处理的服务质量)。

7.3优先级

根据事件的影响和程度,确定事件处理的顺序。

7.3.1 优先级分类

应根据以下二项分类:

a)影响:根据事件对业务的影响(一般业务与关键业务,一个部门与多个部门等); b)程度:业务运行与恢复的紧急度。

7.3.2 优先级确定

应根据以下三项确定:

a)优先级识别、分类、定义、排队; b)依据定义、排队人为判断; c)不同优先级事件的响应时间定义。

8 运营和维护管理体系

应构建运营和维护管理体系,整合、协调各类资源,提升运营和维护服务能力,保障计算机信息系统和业务系统的持续、稳定运行。管理体系应包括:

a)目标和基本原则 b)管理策略和流程 c)人员、资源、技术管理 d)过程模式 e)业绩跟踪与评估 f)服务满意度评估

9. 运营管理 9.1 运营管理目标

优化信息服务成本,分散系统风险,确保跨厂商、跨平台、异构系统的运营效率,满足业务需求的增长和发展。

9.2 需求分析

应识别、整合各类资源,分析、检测系统性能,确定业务系统的需求,保证信息系统运营与业务系统需求的一致。

9.3 运营计划

应根据运营管理服务需求、业务需求、服务水平管理、服务能力管理,制定运营管理计划,确定管理流程,建立运营管理体系,保证计算机信息系统安全、可靠、高效、合理成本运营。

9.4 过程管理

在运营管理服务中,应采用过程模式,不断改进和完善服务过程。

9.5 协调与沟通

在运营管理服务中,应经常与用户沟通和交流,听取用户的意见和建议,协调服务过程中的各种矛盾。

9.6 服务交付

9.6.1 运行交付

计算机信息系统建成并投入运营前,应通过测试、验收,并经过试运行,保证交付信息服务单位运营管理的系统安全、可靠、可用、稳定。

9.6.2 过程交付

服务过程中或过程后交付用户运营时,应: a)完整的管理文档交付; b)完整的管理流程交付; c)管理培训完成;

d)系统安全、可靠、可用、稳定。

9.7 服务评价

应分阶段评价运营服务过程,并在服务结束后,整体评价运营管理服务。

10 维护管理 10.1 维护管理目标

利用各种技术手段,检测、监控计算机信息系统的运行,分析、优化系统性能,及时发现故障、处理故障,保证信息系统和业务系统的持续、稳定运行。

10.2 需求分析

识别、整合、定义、分类各类资源,检测、分析系统性能,确定维护服务需求和范畴。

10.3 维护计划

应根据维护服务需求、业务需求、服务水平管理、服务能力管理,制定维护计划,确定管理流程,建立维护体系。

10.4 沟通与协调

在维护服务中,应随时与用户沟通、交流,了解可能的需求变更,听取用户的意见,不断改进和完善服务过程。

10.5 问题管理

10.5.1 问题识别

应监测、记录、识别、分析系统出现的或潜在的问题,建立问题处理流程,查找引起问

题的原因,降低系统运营的风险。

10.5.2 问题控制

应根据问题的性质分类,确定问题的影响和程度,按照优先级定义排队,定义问题解决方案。

10.5.3 问题跟踪

应跟踪问题处理流程,及时改进和完善。

10.5.4 协调管理

在问题管理中,应协调服务台、变更管理和问题管理,促进问题的预防、解决和管理。

10.6 维护方式

10.6.1 需求确定

依据用户需求,确定计算机信息系统维护服务的类型、内容,明确维护服务的目标,和对服务能力的要求,建立维护服务管理流程。

10.6.2 维护支持

依据用户需求,服务类型、服务内容和服务管理流程,采取不同层次的维护服务和技术支持:

a)定期与非定期维护; b)远程维护; c)现场维护。

10.6.3 维护周期

应实时、快速响应用户的维护请求。

10.7 维护确认

维护工作完成后,经用户评价、确认,签署《维护完成确认书》。

10.8 维护跟踪

应在维护工作完成后,跟踪、监测维护效果,及时改进、弥补各类缺陷、不足。

11 突发事件管理 11.1 评估与分类

应识别、判断、分析、检测突发事件,根据事件的特点、性质明确分类。

11.2 突发事件处理

a)制定突发事件预防预案; b)制定突发事件恢复预案;

c)根据突发事件类别判断事件处理优先级; d)执行突发事件预案;

e)建立协调、沟通机制,有效处理突发事件; f)对突发事件处理实施跟踪。

12 管理机制

在运营和维护服务中,应建立相应的管理机制。应包括: a)工作制度; b)人员规范; c)现场操作规程;

d)安全制度; e)员工培训计划; f)其它相应的管理规范

第四篇:用电信息采集系统运维服务报告

一、

用电信息采集系统(以下简称采集系统)承担着用电信息自动采集、高效共享和实时监控的重要任务,是.智能用电服务体系的重要基础和用户用电信息的重要来源。系统经过近三年建设,已投入大规模应用,城区用户已实现全覆盖,开始向乡镇延伸,抄表率等指标也纳入同业对标考核体系。随着系统的大规模建设,系统的运维服务工作将是建设后期的重点。

二、系统运维现状及问题

当前建设的采集系统主要是将智能电能表、集中抄表终端作为系统的底层基础设施,以低压电力载波、微功率无线、RS-X185 , GPRS/CDMA、光纤专网等为主要通信载体,结合先进的控制手段和软件技术,对电力用户的用电信息进行采集、处理和实时监控的系统。初步统计截止目前国家电网28个直属省公司均已建成用电信息采集系统,己安装智能电能表约1. 1亿只,在运行集中抄表终端(指集中器和专变终端)约百万只。如此庞大的系统,如何保障它可靠、稳定的运行,将是后期工作重点。在当前的运维工作中主要存在如下问题:

1、 缺乏专业化的维护队伍

采集系统由于其资源技术的特有和保密性,在现阶段调试和售后维护基本依靠各供应商来完成,运维工作内外部的定位和分工不是很明确,虽有供应商承担一部分工作,但因为成本和责任的问题易出现内外部维护人员积极性不高、相互推谱、相互依靠的问题。导致服务质量不高,内部人员技术掌握不深入、不全面,而且从人员结构上来说,无相应的岗位设置或相应岗位缺乏专业人员,缺乏一支具备系统和专业知识的运维队伍。

2、运维工作缺乏系统性

采集系统属于集成系统,整个系统涉及的供应商多且分散,在进行运维服

一、前言

用电信息采集系统(以下简称采集系统)承担着用电信息自动采集、高效共享和实时监控的重要任务,是.智能用电服务体系的重要基础和用户用电信息的重要来源。系统经过近三前言 年建设,已投入大规模应用,城区用户已实现全覆盖,开始向乡镇延伸,抄表率等指标也纳入同业对标考核体系。随着系统的大规模建设,系统的运维服务工作将是建设后期的重点。

二、

当前建设的采集系统主要是将智能电能表、集中抄表终端作为系统的底层基础设施,以低压电力载波、微功率无线、RS-X185 , }PRSICDA}}A、光纤专网等为主要通信载体,结合先进的控制手段和软件技术,对电力用户的用电信息进行采集、处理和实时监控的系统。初步统计截止目前国家电网28个直属省公司均已建成用电信息采集系统,己安装智能电能表约1. 1亿只,在运行集中抄表终端(指集中器和专变终端)约百万只。如此庞大的系统,如何保障它可靠、稳定的运行,将是后期工作重点。在当前的运维工作中主要存在如下问题:

1、 缺乏专业化的维护队伍

采集系统由于其资源技术的特有和保密性,在现阶段调试和售后维护基本依靠各供应商来完成,运维工作内外部的定位和分工不是很明确,虽有供应商承担一部分工作,但因为成本和责任的问题易出现内外部维护人员积极性不高、相互推谱、相互依靠的问题。导致服务质量不高,内部人员技术掌握不深入、不全面,而且从人员结构上来说,无相应的岗位设置或相应岗位缺乏专业人员,缺乏一支具备系统和专业知识的运维队伍。

2、 运维工作缺乏系统性

采集系统属于集成系统,整个系统涉及的供应商多且分散,在进行运维服务时各自为政,形成马路警察各管一段的现象,缺乏系统全面的运维思路。如:服务器是生产商,外网是通信运营商,智能电能表是电表供应商,终端设备是终端供应商,本地通信介质是相应的载波微功率芯片供应商。出现问题只是一味的头痛医头,脚痛医脚,不能从整个系统的角度出发审视和解决问题。

3、 系统运维缺乏持续性和连贯性

系统运维现状及问题 随着国家电网公司统一招标模式的开展,竞争淘汰机制加剧,部分供应商难以适应此种竞争形势,被淘汰出局。更多供应商则面临地域分散、售后服务成本增大等诸多问题,而且很多地区与供应商签订的合同承诺售后服务期限已到,各供应商为降低成本导致售后服务出现断档和衔接不上的情况。

4、 系统运维缺乏前瞻性

当前在采集系统运维中的思路是发生问题及时解决、处理,以提高抄表率等指标为工作目标。但对于系统运维工作来说不光需要的是能迅速地定位、解决问题,更重要的是在故障发生前能够发现隐患并消除隐患,使系统长期稳定地运行。这就要求我们在系统运维过程中,需要有一定的前瞻性,防患于未然。如果运维人员能在故障发生之前,在例行巡检之中,及时检测到故障的先兆,将故障解决在萌芽期,这样不但可以避免故障发生后,由于抢修的慌乱、业务中断所造成的经济损失。而且还可以避免故障严重化对整个系统所造成的损伤,从而延长系统的使用寿命。而这一切不但要求维护人员有深厚的功底,丰富的维护经验,还要有洞察秋毫的高度敏感性。

三、

运行维护顾名思义由运行及维护两部分内容组成。运行维护不仅仅是保证系统正常运行,问题出现时能迅速定位、解决问题。而更重要的是在故障产生前,能够通过例行的巡检工作及时发现故障隐患、消除故障隐患,使设备长期稳定地运行。对设备良好、有效的维护,不仅能够减少系统的故障率,并且可以延长设备的使用寿命。基本原则就是在例行运行维护工作中及时发现、解决问题,防患于未然。目前常见的两种运维模式分别是外维和内维。

1、 内维模式

指通过内部人员来承担整个系统的运行维护工作。用电信息采集技术是集电能测量技术、计算机技术和网络通信技术于一体的一门综合技术。要求维护人员在有电能计量知识和安装技能之上,还要学习采集系统工作原理,掌握终端应用功能、设置、安装和故障处理技能,根据岗位要求学习计算机原理、网络通信、采集通信和电表通信规约、了解继电保护等相关专运维解决方案及建议 业知识。不仅人员和岗位需求量大,而且专业化程度要求较高,所以此种模式在当前国家电网公司的发展状况下,存在很多弊端。

2、 外维模式

指将系统运维外包给专业的服务公司,把过程交给专家,自己控制结果,外维服务正成为现代企业发展的趋势。这样不但可以降低系统运营成本,而且系统运营效率也大为提高。智能电能表、终端和系统主站等并不能够保证为企业效益做出贡献,我们需要的是采集系统对企业业务的支持,需要的是运用采集系统的结果。运维服务外维作为专业服务的一种,具有以下几点基本特点:

(1) 基于企业战略发展的选择

尽管服务外维的出现是源于降低企业在系统运营维护方面的日常开支,缩减管理成本,但是现在企业选择外维服务更多的是出于培育企业核心竞争力的考虑。企业将更多的精力和资源投入到自己擅长的核心业务中,而辅助性的业务、非核心的业务则交给外部的专业人士来承担,以获得更高的整体运营效率。服务外维正成为企业实施长期发展战略的重要选择。

(2)履行服务的系统性和延续性

服务外维可以是一种长期的委托行为,一般合同履行的时间比较长,三年、五年,或者十年、几十年。有些合同也比较短,在一年以内。许多外维服务合同规定一段时问的试用期,作为对外维服务商的考察和绩效指标体系设计的基础。

(3)以采集系统之上的业务流程为外维对象

传统外维服务涉及各个行业,而采集系统外维服务的外维对象则是针对采 集系统或者采集系统之上的业务流程。随着外维服务的发展,特别是业务流程 外维的发展,采集系统外维服务包含的内容也会更加广泛,介入内部管理的层 面更加深入,以第三方的角度审视业务流程。

综上所述,采集系统运维外维模式将会成为其实施长期发展战略的明智选 择,具有重要的意义。

三、运维组织分析

用电信息采集系统是集信息通信、计算机网络、海量数据处理、电力自动化技术及营销管理于一体的集成系统,涉及业务层知识面广、技术层知识面深,必须具备足够技术和业务水平的公司方能站在系统全面的角度进行运维工作,以其服务的专业性、前瞻性、持续性来推动系统的运维工作的良性进行。

1、组织简介

南瑞集团是国家电网公司直属产业单位,2012年经过产业重组整合得到进一步发展壮大,主要从事电力系统二次设备、信息通信、智能化中低压电气设备、自动化设备等的研发、设计、制造、展与外延式扩张相结合,产业实力雄厚,销售及工程服务。集团坚持内涵式发 下设31个产业公司,京、武汉、合肥等10多个地区,形成电网自动化及工业控制、分布在南京、北信息通信、继电保护及电力电子、智能化电气设备等优势明显、业务突出的产业群,具有300多个自主知识产权的高新技术产品,初步形成覆盖智能电网各环节的完整产品链。

2、组织结构

南瑞集团组织结构划分主要分职能部门、支撑机构、专业机构、产业群四大板块,其中产业群主要包括:营销与工程总包、电网自动化及工业控制、信息通信、继电保护及柔性输电、发电及水利环保、智能化电气设备、非晶合金变压器、电线电缆八大产业。信息通信板块涵盖了智能用电的整个产品链,从智能用电硬件设备的研发、制造、生产及用电信息采集系统软件的技术开发、实施,到整个系统的维护与售后服务都有着完备的技术力量支撑,完全具备承担采集系统整体运维工作的能力和资格。

四、运维服务内容及费用核算

从用电信息采集系统的运行性能、稳定可靠性、在线状态、业务管理三个方面实现对用电信息采集系统的运维管理,基本服务内容如下:

l、服务内容

服务内容的需求是多方面的,从服务能力来区分,可以分为基础服务(包括工程服务、维护服务)、专业服务、运营咨询服务等多个方面。

(1) 用户现场技术人员值守

可根据用户的需求提供长期的用户现场技术人员值守服务,保证系统的正常运转。现场值守的技术人员每天查看系统运行情况,进行整体系统性能评估,针对运行情况进行优化并提出合理化建议。 (2)现场巡检服务

现场巡检服务是我公司对客户的设备及网络进行全面检查的服务项目,通过该服务可使客户获得设备运行的第一手资料,最大可能地发现存在的隐患,保障系统稳定运行。同时,我公司将有针对性地提出预警及解决建议,使客户能够提早预防,最大限度降低运营风险。 (3)重要时刻专人值守服务

我公司深刻知道保证重要时刻设备稳定运行对客户成功尤为关键,因此,我公司可对客户提供重要时刻的专人现场值守支持,包括结算日或客户认为可能对其业务运营产生重大影响的时刻。

(4)系统运行分析与咨询管理服务

系统运行分析与咨询管理服务是指我公司工程师通过对系统运行状况、系统问题进行周期性检查、分析后,为客户提出指导性建议的一种综合性服务。 (5)技术培训

不定时对系统的使用进行现场培训,提高客户技术实力和专业水平。

2、服务流程

我公司采用的服务方式主要为两种:一种为技术人员现场值守,另一种是定期巡检结合故障现场服务。

技术人员现场值守运行维护服务的基本操作流程如下图所示:

定期巡检结合故障现场运行维护服务的基本操作流程如下图所示:

3、费用核算

按照目前采集系统系统部署、终端类型、运行模式及地点分布,运维费用预算按年度进行核算,大致核算方式如下:

第五篇:运维管理系统建设

ITIL提升中国电信运维管理系统建设

ZDNet CIO频道 更新时间:2008-01-25 作者: 来源:CSDN 本文关键词: 中国电信 ITIL 运维管理

运维管理是电信运营商主要的生产和管理活动之一。运维管理系统建设和运营的好坏直接影响到电信运营的整体成本、管理水平和服务水平。因此,近两年来,各大电信运营商纷纷对现有的运维系统进行改造。

中国在电信领域的增长速度超过了其GDP增长的速度。正是电信快速的增长,推动了运维系统的发展。如何更有效地利用现有的资源,提高运营维护的工作效率,提高整体服务质量是目前各大运营商面临的普遍问题。毫无疑问,中国电信在运营维护方面,也面临相同的问题。建设新一代中国电信运维管理系统,成为解决目前运维管理问题的唯一方案。

根据我们长期在电信领域的实践,下面的几点经验,值得我们在中国电信运维系统的建设中更加关注。

一、采用ITIL作为运维系统的方法论

IT基础架构库(ITIL-ITInfrastructureLibrary),被誉为IT服务管理的圣经,其中包含了总结国际大公司在IT服务管理中的经验并得到证明的IT服务计划和运营的最佳实践框架。

ITIL已经为《财富》500强的一些企业所采用,并取得了预期的效果。加特纳(Gartner)和国际数据集团(IDC)等世界权威研究机构的调查研究表明,企业通过在IT部门实施最佳服务管理实践,将因重复呼叫、不当的变更等引起的延误时间减少了79%,每年每个终端用户平均节约800美元的成本,同时每项新服务推出的时间也缩短一半。

要成为国际一流的企业,就要吸取国际一流企业的成功管理经验,借鉴其管理手段。因此,中国电信在运维管理系统的建设,也应确立ITIL在系统建设过程中的方法论地位,吸取ITIL中的成功经验。

作为众多国际大型企业成功实践的积累,ITIL使我们找到了解决运维流程规范的方式和方法。可是,如何更好地运用ITIL这一经典的方法论呢?我们认为应该注意两点:

1)ITIL是从实践中得来的精髓,不是僵化的教条,应该结合实际情况去运用ITIL,建立更加适合中国电信的流程规范,而不是照抄照搬。

2)由于ITIL理论博大精深,不可能在短期内在企业中全面实施。应该根据实际情况,选取实施重点,逐步实施,逐步完善。

在中国电信运维系统建设中,应该深入理解ITIL的核心理念,结合电信运维的现状,解决核心和关键问题,逐步实现对运维的科学管理。

二、ITIL理论与实际情况相结合,注重工作流程细节的设计和优化,是系统建设的关键

理顺工作流程、提高服务效率是新运维系统建设的主要内容之一。

在工作流程的制定过程中,容易陷入以下两个极端。

1.盲目照搬流程。作为方法论的ITIL,本身含有大量的成功实践框架。但是,正如前面所说的,ITIL是从实践中得来的精髓,不是僵化的教条,盲目照搬,只能使得工作流程不切合实际,并流于形式,对系统的贯彻和执行产生不好的影响。

2.完全遵照现有流程,实现其电子化。虽然这样更符合目前的工作习惯,可能容易为运维人员所接受,但是,仍然解决不了目前运维所存在的一些问题。例如,我们在项目实施中曾遇到“工单在部门之间的重派”的问题。在当前手工作业的工作模式中,各单位将不属于本单位处理范围的工单,或部门需要其他部门配合的工单,均提交给故障处理的负责人,由该负责人向其他单位进行转派和重派。这种处理方式,主要便于手工作业条件下负责人及时了解项目处理状况。在建立运维系统后,负责人可以通过运维系统随时了解到故障的处理状况,每次重派和转派之前,对负责人的回复变成了一种无效的工作,大大降低了事件的处理效率。如果仅仅将目前的手工作业电子化,那么故障处理的效率仍然没有得到有效的提高。

因此,将ITIL理论与实际情况相结合,注重工作流程细节的设计和优化,是系统建设的关键。

三、树立主动服务观念

在现行的运维工作中,我们经常遇到这样的情况:一方面是运维部门疲于应付各种突发事件,加班加点处理各种重复事件,工作繁重,身心疲惫;一方面是客户代表不断抱怨和投诉“技术人员服务水平太低”。二者不可调和的矛盾,是新运维系统要解决的重要问题。

传统的运维方式给人的印象是:故障发生前,维护人员似乎无所事事;故障发生后,则是手忙脚乱。这就是被动服务给人们留下的印象,运维人员是在被动地等待故障的发生。在新的运维系统中,我们必须改变原有的运维方式,变被动服务为主动服务。

在主动服务模式下,运维人员主动地监控系统的变化,对日常工作及故障处理完成后主动进行问题分析,对系统的变更风险进行评估。在新系统中,可以通过种种技术措施,使得运维工作从被动服务转移到主动服务,如:增加变更管理流程以防范变更风险。

在日常运维工作中,变更工作是在所难免的。例如,新的系统安全漏洞被公布,为了保证系统安全,就需要安全系统补丁,而这种变更给系统带来的风险则是难以估计的。例如在安装补丁后,有时会产生大量莫名其妙的问题。这么一个简单的例子已经可以说明,如果没有很好的风险防范手段,系统变更将给我们的日常运维工作带来大量的问题,后果往往是难以想象的。在新系统中,我们可增加变更管理流程。在变更管理流程中,变更方案需提交变更经理,由变更经理组织由专家组成的变更顾问委员会(CAB)对变更进行风险评估,在评估通过后才能够进入变更的实施过程。变更管理是防范变更风险的最好办法。

当然,主动服务是一种理念,在这种理念下,我们可以定义更多的流程,如问题管理流程,对系统中存在的隐患问题进行挖掘,防患于未然。总之,我们应该树立这样一个理念,在各流程的定义中进行运用,主动地提早发现系统存在的风险和隐患,减少突发事件的发生。

四、从平台到业务的全面管理

网络管理是运维系统的组成部分。对系统的监控也是运维的主要业务之一。以往网管系统实现了对平台的监控,可是在实际运维工作中,平台往往只有少数的几个系统管理员负责,大多数业务人员更多地是面对业务系统。对于业务的监控和管理,是业务人员更加关心的问题。因此,在网管系统中,应加入业务监控的内容。

需要注意的是,业务是建立在平台的基础之上的,而不是孤立存在的。因此,监控中,应强调业务监控与平台监控密不可分的联系,从业务的角度出发,建立平台与业务的关联关系。在故障发生时,应能够即时描述对业务的影响程度,能够描述故障的影响范围。

例如:采集源的某台交换机产生异常,除了可以看到交换机告警外,我们还应该能够在业务拓扑图中直观看到,采集系统受到影响,同时采集、预处理、分拣等相关业务也不同程度受到影响。其影响程度,能够通过不同的颜色直观地展示出来。

只有这样才能够更加直观而全面地反映系统的运行状态,反映业务的运行情况。能够帮助运维人员在故障发生时,快速修复关键部件,减少故障带来的损失。

五、建立科学的激励与监督机制

多年来,系统的使用和推广问题成为系统能否得到良好运用的一个重要问题。

假设:我们制定了变更管理流程,但是,变更管理没有被很好地执行,而只是流于形式,则风险的防范也只能是停留在理论上的空谈。

在运维系统建设过程中,建立了一整套科学的考核制度,以激励运维人员更有效地提高服务质量和服务水平,是至关重要的。

对运维人员的考核,并不能就管理论管理,应该从客户服务的角度出发,以客户满意为前提,进行考核。例如,根据每个部门的服务水平,制定了服务时限。假设,某个用户投诉,需要多个部门协同进行处理。在处理过程中,各部门互相推托,虽然工单在各部门的停留时间没有超过部门承诺的时限,而整体处理时间已经超过了运营商对该用户承诺的处理时间。为了杜绝这种现象的出现,我们应该从用户的角度出发,进行各部门处理时间的分段计算。计算结果将反映在每月故障处理情况的统计报告中,而这些报告直接与各部门、各单位的绩效考核挂钩。

通过这样的考核机制,形成对员工日常工作的科学评价,既调动了员工积极性,又提高了工作效率和服务质量。

本文来自 99学术网(www.99xueshu.com),转载请保留网址和出处

上一篇:学习先进老师心得体会下一篇:学校兴趣小组活动方案