运维管理规定贯彻

2022-08-11

第一篇:运维管理规定贯彻

运维管理规定

运维规范

第一章 总则

1. 为加强公司各个项目后期的系统运维管理,确保系统能够平稳、可靠地运行,更好地为客户提供管理服务,特制定本规定。

2. 本规定适用所有进入运维环节的项目。

3. 运维人员应根据授权,处理本规定中所涉及的业务事项。

第二章 主机、服务器及数据库系统的运维管理

1. 根据应用需求,主机、服务器及数据库系统的配备和安装、以及系统资源的使用等由公司项目实施部统一规划。

2. 应指定专人作为系统管理员(系统工程师)和数据库管理员,对系统的运行、管理、维护和安全负责,并按照有关规定负责系统和数据的备份与恢复。 3. 系统/数据库管理员应定时对系统进行监控和定期的健康性检查,分析系统运行和资源使用状况,并进行必要的优化、调整和修正,及时消除隐患。如系统设置发生变化,或重新安装系统,或安装了新软件,应在此后15个工作日内对系统进行密切跟踪。

4. 及时解决处理系统运行过程中出现的异常问题和软硬件故障,并采取必要措施,最大限度地保护好系统资源和数据资源。

5. 对于重大软硬件系统故障,应立即通知部门领导,协调服务商,使系统尽快得以恢复运行;对于应用系统引发的系统异常或故障,应及时通知相关人员,并协同解决处理。

6. 每季度应对系统主机/服务器/数据库进行一次停运维护,其操作必须严格按照操作规程进行。其他非正常性停运(故障引发的除外),应提出书面申请,并经部门领导批准后方可进行。同时做好相应的准备工作,最大限度地减少对业务操作带来的影响。

7. 具有系统操作或管理权限的人员调离工作岗位或离职,应立即从系统中删除该用户;如该人员掌握超级用户口令,应立即更换口令。

第三章 软件系统的运维管理

1. 避免在用户工作时间进行软件版本升级工作,以免由于人为失误造成业务中断。 2. 软件系统的安装、升级等操作应保留完整的实施记录。

3. 对软件系统进行升级、更新补丁,应首先进行相关的测试,并在确认无误后实施。

4. 对软件系统进行升级、更新补丁,或进行系统的重新安装等操作,应在实施前对原有系统及数据进行备份。

5. 变更系统配置,修改配置文件、参数文件时,应对原始配置数据(或文件)进行保留。

6. 软件进行版本升级时,对于不影响业务的升级工作,须以书面形式详细将计划、方案、措施等报上级主管部门备案;对于影响业务的升级工作,必须提前两周向上级通信主管部门以书面形式提出申请详细报告计划、方案、措施等,经批7.

1. 2. 3. 4. 5. 6. 准后方可实施。

维护人员应定期跟踪所使用系统的软件升级情况和升级后的新功能,必要时提出升级建议。

第四章 数据库的运维管理

对于数据库的变更必须有记录,可以回滚。 无用表和字段要及时清理。

从数据库删除数据一定要先备份再删除。

定期对数据库数据进行自动备份,以便在故障发生后尽快恢复最新的数据。定期检查备份的执行情况,确保备份操作正确执行。 指定专人定期进行备份数据的恢复性试验。

1、严格操作原则:在系统上进行可能影响系统运行的参数设置、更改和维护等操作时,须有2人以上在场进行监护和确认,并作好详细的操作记录;

2、提前沟通确认原则:软件进行版本升级时,对于不影响业务的升级工作,必须提前与客户方进行沟通,避免操作中人为失误造成业务中断;对于影响业务的升级工作,须提前与客户方进行确认,达成一致后方可实施。

3、遵守保密原则:对被运维系统单位的网络、主机、系统软件、应用软件等的密码、核心参数、业务数据等负有保密责任,不得随意复制和传播。

第五章 相关流程

第二篇:运维管理定义

运维管理( IT Operations Management)帮助企业建立快速响应并适应企业业务环境及业务发展的IT运维模式,实现基于ITIL的流程框架、运维自动化。

核心思想随着国内企业业务信息化的深入, IT运维部门所负责的IT设备及软件的运行维护工作变得越来越复杂, 技术难度也越来越高。传统的IT工具和流程集中在技术上,而不是业务目标上。业务服务管理(Business Service Management)使IT能轻松满足业务的需求,转变企业的环境,使业务部门和IT部门领导者能够拥有统一的语言,通过统一的界面面对挑战,理解新变化所带来的影响。

BSM主要强调从业务的视角来看待企业的IT运维,从而最大化发挥IT对企业业务的推动作用,这就IT运维的核心思想。

着眼点IT系统的业务服务管理主要着眼点

一、 确立以业务价值为核心,业务驱动管理的管理思想面向业务要首先在IT管理的战略层面上建立“业务驱动”的IT治理和管理思想,使得业务部门的目标和IT运维的目标一致,都是为了企业整体战略目标的实现,把对业务的支撑能力和管理实效,作为评价IT系统效用和IT部门工作的首要指标。只有这样,才能在全企业范围内建立“技术服务于业务发展”的意识和文化,是真正实现IT与业务融合,共同为企业的战略目标服务。

二、 建立关键业务服务模型今天的业务部门对应用程序的依赖性比过去更强了。应用程序软件可以实现关键业务流程的自动化 —自动化既包括付款、资金转账、下订单和订单履行。由于应用程序故障或性能问题可能导致严重的业务影响,因此业务部门迫切需要 IT 部门在发生问题时提供更高的应用程序服务级别和更快的问题解决方案。所以,必须结合企业战略和目前业务运营情况,辨识企业业务服务,特别是关键业务应用。为这些核心业务系统服务,建立和企业未来发展愿景、目前IT架构、管理模式等相适应的业务服务模型,能够清晰地描述业务与IT之间的关联关系和IT服务的关键目标。

三、 管理信息共享目前,出于对IT资源专业化、精细化管理的要求,企业部署了诸多的监控管理工具,如网络监控、系统监控、数据库监控工具等。一般来说,这些监控工具往往来自于不同的厂商,彼此之间缺乏信息共享的手段。而一个具体的业务是由网络、主机、应用本身所组成,管理信息无法共享,这就造成了当一个故障出现时,无法通过系统直接自动分析并定位故障点,加大了IT故障的分析难度,降低了解决问题的效率。业务服务管理可以有效整合企业已经构建的众多IT监控系统,将分散的IT管理信息集中到一个单点的管理平台中,从而可以快速进行故障定位。

四、 根源问题定位随着企业业务的快速发展,IT环境越来越复杂,IT组件越来越多,同时各组件之间的关联关系也更加纷乱和复杂。业务服务管理能够提供有效的根源问题定位能力,它着眼于企业的核心业务系统,通过集中与业务相关的IT信息,根据业务逻辑和IT组件之间的关联关系进行建模,企业可以在业务模型中的任何一点进行快速的根源问题分析和定位,大大提高了解决问题的速度和准确度。

五、 故障影响范围评估当我们发现IT故障时,我们不仅应该关注故障本身,更应该考虑该故障对业务系统的影响。通过建立业务服务影响拓扑,可以快速的了解企业的关键性业务及业务故障时的影响范围,通过了解企业具体的业务环境,优先处理关键故障点。

第三篇:系统运维管理-IT基础设施运维管理规范

IT 基础设施运维管理规范 文件编号:运维-002-V1.0

目录

运维管理规范-------------- 4 1. 目的 ------------------------ 4 2. 适用范围 ------------------ 4 3. 规范性引用及参考 ----- 4 4. 本文术语,定义和缩略语 --------------------------- 5 5. 基本要求 ------------------ 6

5.1运维管理原则----- 6 5.2制度和流程管理6 5.5供应商管理 -------- 7 5.6督促检查 ----------- 7 6. 运行维护 ------------------ 8

6.1日常操作及监控分析 -------------------------- 8 6.2 数据与介质管理 - 8 6.3机房管理 ----------- 9 6.4 网络管理 ---------- 9 6.5 弱电管理 --------- 10 6.6桌面维护 ---------- 10 6.7服务器及系统变更 ---------------------------- 11

6.8 配置管理 --------- 12 6.9 事件与问题管理 12 7. 应急管理 ----------------- 12

7.1应急准备 ---------- 12 7.2应急处置 ---------- 13

运维管理规范

1. 目的

为规范公司运维工作,使相关工作具有持续改善及相互协作性,同时加强计算机设备的管理及维护,确保维修工作的及时性,降低计算机设备的报修率,实现业务与技术的融合,将业务部门与IT 部门紧密结合在一起,根据公司管理要求及计算机应用的需要,由运维部制定。

2. 适用范围

本规范规定了运维管理工作的要求。

本规范适用于维信理财集团(中国) 总部,包括全国各分部及门店。

3. 规范性引用及参考

◆ IT 服务管理国际标准ISO/IEC 20000 ◆ 企业获得ISO/IEC 20000认证的权威指南 ◆ 全球著名IT 服务管理书库(ITSM Library) ◆ IT 服务质量管理原则

◆ 理解ISO/IEC 20000在IT 服务中的地位 ◆ ISO/IEC 20000规范和实践准则 ◆ IT 服务管理国际标准ISO/IEC 20000 ◆ GB/T 20269—2006 信息安全技术 信息系统安全管理要求

◆ ISO 31000:2009 风险管理 原则和指南(Risk management -- Principles and guidelines)

◆ JR-T 0060—2010 金融信息系统安全等级保护基本要求 ◆ JR/T 0074-2012 金融IT 服务管理基本规范 ◆ 中国金融标准化报告(2011)

4. 本文术语,定义和缩略语

1、 IT: Information Technology 信息技术

2、 DNS: Domain Name Service 域名服务

3、 DHCP: Dynamic Host Configuration Protocol 动态主机配置协议

4、 VPN: Virtual Private Network 虚拟专用网

5、 OA: Office Automation 办公自动化系统

6、 ISO: International Organization for Standardization 国际标准化组织 编订日期:30.7.2014 批准日期: 生效日期:

7、故障: IT设备或系统丧失规定的功能,导致服务中断或降质,或对正常运行造成潜在威胁。

8、异常: IT设备或系统的状态发生超出预期的变化或性能指标参数超出正常范围,有可能引发或已经引发故障,需要引起运维人员关注或处理。

9、资料: IT设备或系统的运行记录,包括IT 设备或系统的配置、故障历史记录、软硬件扩容或调整记录、权限变更申请记录等。

10、运行维护:本规范中的运行维护包括IT 基础设施维护、IT 应用系统运维维护、安全管理、网络接入、内容信息以及综合管理等。

5. 基本要求

5.1运维管理原则

公司按集中与分散相结合的原则,设立机房、各部门配备电脑。计算机系统本着“总体规划、分步建设”的方式实施建立。

计算机系统建设应综合考虑成本、费用、效率、效果、先进性及适用性,选择最优技术、经济方案。

5.2制度和流程管理

运维管理制度应包括但不限于机房管理、网络与系统管理、数据和介质管理、配置管理、安全管理、监控管理、文档管理、设备和软件管理、供应商管理等制度。

运维操作流程应包括但不限于日常操作、事件处理、问题处理、系统变更、应急处置等流程。

5.3 文档管理

对运维过程中涉及的各类文档进行管理,可按照制度文档、技术文档、合同文档、审批记录、日志记录等进行分类,并妥善保存。 5.3.2 对文档的版本应当进行控制。

文档在使用时应能读取、使用较新版本,防止作废文件的逾期使用。

5.4设备和软件管理

建立计算机相关设备和软件管理制度,对设备和软件的使用、安装、维修(升级)等进行规范。明确设备和软件管理责任人。对设备进行标识,标识应放在设备明显位置。

规定设备和软件的使用年限,定期进行盘点,并对设备状态进行评估和更新。

对外送设备的维修进行严格管理,防止数据泄露。

对拟下线和拟报废设备的存储介质中的全部信息进行清除或销毁。对正式下线设备和软件交指定部门统一管理、保存或处置,并保留相应记录。设备和软件报废应符合公司现行资产管理规定。

5.5供应商管理

对供应商支持运维服务的相关活动进行统一管理。

在与供应商签订的合同中明确其应承担的责任、义务,并约定服务要求和范围等内容。

应定期收集、更新供应商信息,组织对供应商的服务质量、履约情况、人员工作情况等内容进行评价,并跟踪和记录供应商改进情况。加强运维外包服务管理,主要包括:

a) 明确外包公司应当承担的责任及追究方式;

b) 明确界定外包人员的工作职责、活动范围、操作权限; c) 对外包人员工作情况进行监督和检查,并留存相应记录; d) 对驻场外包人员的入场和离场进行管理; e) 定期评估外包的服务质量; f) 制定外包服务意外终止的应急措施。

5.6督促检查

定期检查审计,对运维制度的执行情况和运维工作开展情况定期进行检查和审计,以督促运维工作持续改进。

指定人员负责对日常操作执行情况进行检查,确保运维管理制度和操作流程的有效执行。对检查和审计结果采取纠正、预防措施。

6. 运行维护

6.1日常操作及监控分析

未经许可,任何人不得随便使用电脑及相关设备。不得更换电脑硬件和软件,拒绝使用来历不明的软件和移动设备。

电脑发生故障时,使用者作简易处理仍不能排除的,应立即报告IT ,非专业管理人员不得擅自拆开机箱或调换设备配件。

计算机及其相关设备的报废需经过IT 部门或专职人员鉴定,确认不符合使用要求后方可申请报废。

运维应采取各种监控措施,配备视频、语音、系统监控和报警工具,对影响信息系统正常运行的关键对象,包括机房环境、网络、通信线路、主机、存储、数据库、核心交易业务相关的应用系统、安全设备等进行监控。

主要监控指标具体如下:

a) 机房:电力状态、空调运行状态、消防设施状态、温湿度、漏水、人员及设备进出等;

b) 网络与通信:设备运行状态、中央处理器使用率、通信连接状态、网络流量、核心节点间网络

延时、丢包率等;

c) 主机:设备运行状态、中央处理器使用率、内存利用率、磁盘空间利用率、通信端口状态等;

d) 存储:设备运行状态、数据交换延时、存储电池状态等;

e) 安全设备:设备运行状态、中央处理器使用率、内存利用率、端口状态、数据流量、并发连接数、安全事件记录情况等;

6.2 数据与介质管理

配合数据应用部,对核心业务数据进行周备份,并每季度进行恢复性测试。

对设备和人员出入进行管理。进入机房应限制和监控其活动范围,并有专人陪同;未经批准不得接入生产环境。

6.3机房管理

对机房环境、供电、空调、消防、安防等基础设施的运行维护、设备和人员出入、机房工作人员等进行规范管理。

应指定机房管理负责人。 确保机房环境整洁和安全,包括:

a) 应定期检查防水、防雷、防火、防潮、防尘、防鼠、防静电等措施的有效性;

b) 应保持机房环境卫生,设备摆放合理,归类; c) 不得随意出入机房。

d) 未经审批不得接入其它用电设备。

6.4 网络管理

确保网络、系统的正常运行。网络管理应包括: a) 绘制网络拓扑图,并保持更新;

b) 应保持网络设备的可用性,及时维修、更换故障设备; c) 应负责网络系统的参数配置、调优; d) 应定期对系统容量进行检查和评估;

e) 应定期检查网络设备的用户、口令及权限设置的正确性;

f) 应定期对整个网络连接进行检查,确保所有交换机端口处于受控状态; g) 应对网络信息点进行管理,编制信息点使用表,并及时维护和更新,确保与实际情况一致。计

算机网络跳线应整齐干净,跳线标识清晰;

h) 应制定网络访问控制策略,应合理设置网络隔离设施上的访问控制列表,关闭与业务无关的端口;编制文档并保持更新;访问控制策略的变更应履行审批手续。

权限管理应包括如下要求:

a) 权限分配应履行审批手续,权限设置后应复核; b) 应按照最小安全访问原则分配用户权限; c) 应在用户账户变化时,同时变更或撤销其权限; d) 应定期检查权限设置的有效性。

6.5 弱电管理

严格按图纸施工,在保证系统功能质量的前提下,提高工艺标准要求,确保施工质量。质量检查制度,现场管理人员将定期进行质量检查并贯穿到整个施工过程中。统运行验收:当设备安装完毕并调试运行无误后,由公司派现场调试人员进行系统联调,并向上级汇报调试结果。运维对弱电设备的综合管理,包括技术资料、档案的收集。同时,每月一次对弱电设备运行状况进行检查,并及时处理汇报问题。

6.6桌面维护

日常数据注意事项:

a. 个人文件(Excel 、Word 、PDF 等)建议员工不要存放在系统盘(通常为C 盘),可以存放在其它盘符。

b. 工程师可通过多种方式或途径来告知员工如何进行日常文件的备份,如:口述、邮件、培训等。

c. 未经许可,禁止使用U 盘,移动硬盘,手机或其它外设,如:网盘、邮箱等,盗取公司内部文件。

重装系统前注意事项:

a. 询问用户有哪些相关数据需要备份,如桌面、我的文档、收藏夹、邮件等。b. 用户Email 的备份:如客户端为Outlook 则导出相关OST 或PST 文件;硬件损坏需更换或维修时,运维人员进行测试,明确是否真实异常,不可随意更换。

关于账号、权限、密码

a. 必须严格按照公司制定的IT 策略进行管理,不可私自制定规范。 b. 禁止私自把个人管理员权限借给他人或告知他人。

c. 禁止为他人开设规定以外的权限,如:本地管理员、其他部门目录访问权限、上网权限、电话权限等。

d. 更改任何类型用户权限时需得到相关审批层级确认才可执行。 e. 如电脑无特殊应用需求,则一律为“user”普通权限。

f. 人员离职时,总部和分部应及时通过OA 确认,删除离职人员的相关账号与信息。

g. 妥善保管自己所知的密码。

6.7服务器及系统变更

不得在服务器上使用带有病毒和木马的软件、光盘和可移动存贮设备,使用上述设备前一定要先做好病毒检测;不得利用服务器从事工作以外的事情,无工作需要不得擅自拆卸服务器零部件,严禁更换服务器配套设备。不得擅自删除、移动、更改服务器数据;不得故意破坏服务器系统;不得擅自修改服务器系统时间。

使用空闲主机,对服务器系统补丁进行升级测试,运行平稳后,各服务器升级安装补丁,弥补系统漏洞;为服务器系统做好病毒及木马的实时监测,及时升级病毒库。

管理员对管理员账户与口令严格保密、重要数据库,网站,APP 等服务器由研发配合定期修改密码,以保证系统安全,防止对系统的非法入侵。

任何无关人员不得擅自进入主机房,需要进入的须征得服务器管理人员同意。应注意保护机房内的设备和物品,未经允许的非管理人员不得擅自操作机房内设备。

严禁携带易燃易爆和强磁物品及其它与机房工作无关的物品进入机房,机房内严禁吸咽。除管理员外,任何人不得随意改动服务器内系统及环境配置。

除系统管理员或授权参加系统管理的人员外,任何用户不得以任何方式获取(或企图获取)超级用户权限。

6.8 配置管理

明确配置管理负责人。

建立配置文档库,对服务器、存储、网络、安全设备,操作系统、应用软件、数据库等进行管理。

定期对配置进行备份及文档库归类。

及时检查并定期审计,对发现的不一致情况及时纠正修改。

6.9 事件与问题管理

对运维事件的处理进行规范,对发生的所有事件,根据事件的影响程度和影响范围评估事件处理优先级并及时处理。

对所有事件响应、处理、结束等过程进行跟踪、监督及检查。对问题进行分析、提出解决方案,通过变更管理审批后部署实施。

7.应急管理

7.1应急准备

明确网络、系统等事件的应急指挥决策机制,负责网络与系统事件的预防预警、应急处置、报告和调查处理工作。

网络与系统应急管理应遵循“谁主管谁负责、谁运行谁负责”、“统一指挥、密

切协同;注重预防、减少风险;科学处置、及时报告;以人为本、公平优先”的原则。

应急准备应符合如下要求:

a) 系统管理员、网络管理员、安全管理员等关键岗位应熟练掌握应急预案,能有效处置相关事件;

b) 在自身力量不足以满足应急要求的情况下,应与相关供应商签署服务保障协议。协议内容应包

括双方联系人、联系方式、服务内容及范围、应急处理方式等。应定期检查和评估协议的执行情况,确保服务保障措施落实到位,确保在应急处置中相关单位能提供及时有效的技术支持;

c) 应建立有效的应急通讯联络系统,确保信息畅通;

7.2应急处置

在发生网络与系统事件后,迅速采取应急措施,尽快恢复信息系统正常运行,如有重要情况应及时上报。

暂时无法确定事件原因、责任和结论的,应先给出事件的初步分析判断,并组织力量尽快查找原因,给出解决方法,采取整改措施。

第四篇:电站运维管理

光伏发电生产管理

光伏发电生产管理主要包括:生产运行与维修管理(运维一体化管理)、安全与质量管理、发电计划与电力营销管理、大修与快速响应管理、物资仓储管理、生产培训与授权管理和文档与信息管理。生产运行与维修管理是生产领域的核心,其他管理手段辅助生产运行和维修管理,各版块相辅相成必不可少。如图1:

图1 生产运维体系架构

一、生产运行与维修管理 1.运行管理 (1)工作票管理

工作票对设备消缺过程中安全风险控制和检修质量控制具有重要的作用。工作票编制时需要细化设备缺陷消除过程的步骤,识别消缺工作整个过程的安全风险(人员安全和设备安全),做好风险预判工作,主要包含:工作位置(设备功能位置和工作地点)、开工先决条件、工作步骤、QC控制点、工期、工作负责人、工作组成员、工作风险及应对措施、备件(必换件和可换件)、工具(常用工具和仪器仪表)等;工作票对工作过程中的关键点进行控制,结合质量管理中QC检查员的作用设置W点(见证点)和H点(停工待检点)以保障工作质量;工作票执行时需要严格执行工作过程的要求,严把安全质量关;工作票执行完毕后必须保存工作记录和完工报告。 (2)操作票管理

操作票使用在对电站设备进行操作的任何环节。操作指令需明确,倒闸操作一般由两人进行操作,操作人员和监护人员共同承担操作责任,核实功能位置、隔离边界、操作指令、风险点后按照操作票逐条进行操作,严禁约定送电。所有操作规范应符合《国家电网倒闸操作要求》。 (3)运行记录管理

运行记录分纸质记录和电子记录两部分,纸质记录主要为运行日志,运行日志记录电站当班值主要工作内容、电站出力、累计电量、故障损失、限电损失、巡检、缺陷和异常情况、重要备件使用情况等;每日工作结束后应在电站管理系统中记录当日电站运行的全面情况,纸质运行日志应当妥善保存。电站监控和自动控制装置监控的运行记录应每日检查记录的完整性,并妥善保存于站内后台服务器(信息储存装置或企业私有云)。

(4)交接班管理

电站交班班组应对电站信息、调度计划、备件使用情况、工具借用情况、钥匙使用情况、异常情况等信息进行全面交接,保证接班班组获得电站的全面信息;接班班组应与交班班组核对所有电站信息的真实与准确性,接班班组值长确认信息全面且无误后,与交班班组值长共同在交接班记录表上签字确认,完成交接班工作。

(5)巡检管理

巡检分为日常巡检、定期巡检和点检三种方式,日常巡检是电站值班员例行工作,按照巡检路线对电站设备进行巡视、检查、抄表等工作,值班员应具备判断故障类型、等级和严重程度的能力,发现异常情况按照巡检管理规定的相关流程进行汇报和处置,同时将异常情况应记录在运行日志中。定期巡检是针对光伏电站所建设地点的气候和特殊天气情况下进行的有针对性的巡检;点检是对重要敏感设备进行加强巡视和检查,保证重要设备可靠运行的手段。

(6)电站钥匙管理

电站设备钥匙的安全状态对电站运行安全有着至关重要的作用,电站钥匙分设备钥匙和厂房钥匙,电站所有钥匙分两套管理,即正常借用的钥匙和应急钥匙,应急钥匙由当班站长保存,正常借用的钥匙借出和还回应进行实名登记,所有使用人员应按照规定进行钥匙的使用。设备钥匙应配备万能钥匙,万能钥匙只有在紧急事故情况下经站长批准才能使用,其他情况下不得使用。

(7)电量报送管理

电站值长应每月月末向总部报送当月电量信息。每月累计电量信息应保持与运行日志一致,每月累计故障损失电量信息应与设备故障电量损失信息保持一致,电量信息表编写完成后应由电站站长复核电量信息后报送总部,报送格式应符合总部管理要求,报送电量信息应真实、准确。

2.维修管理 (1)工作过程管理

工作过程管理是规范电站员工工作行为准则,电站任何人员进行现场工作应遵循电站工作过程管理以保证电站工作的有序性。工作过程管理包含:电站正常工作流程、紧急工作流程、工作行为规范、工前会、工作申请、工作文件准备、工作许可证办理流程、工作的执行与再鉴定、完工报告的编写等内容。

(2)预防性维修管理

预防性维修是指电站有计划的进行设备保养和检修的活动。预防性维修管理包含:预防性维修项目和维修周期的确认、预防性维修大纲编制、预防性维修计划编制、预防性维修准备、停电计划、停电申请流程、日常预防性维修、大修预防性维修、预防性维修等效、组件清洗计划编制、预防性维修实施、预防性维修数据管理等内容。

(3)纠正性维修管理

纠正性维修是指非预期内的故障发生时进行的维修活动。纠正性维修的主要分类有在线维修和离线维修,按照响应时间分类有:临时性维修、检修、抢修,按照维修量级分类有:局部维修、整体维修、更换部件、更换设备。纠正性维修主要考虑的因素有:故障设备不可用对其所在系统的影响,以及该系统对机组乃至电站的影响;缺陷的存在对其设备的短期及长期影响,以及该缺陷设备故障后的潜在后果;故障或缺陷设备对工业安全和外部电网的影响。纠正性维修的对象一般为比较紧急必须处理的故障,隔离边界较少,对检修要求高,纠正性检修需要做到快速判断故障原因,准确找到故障点,做好安全防护措施,及时消除故障保障系统和电站正常运行。

(4)技术监督试验管理

技术监督试验的目的在于依据国家、行业有关标准、规程,利用先进的测试管理手段,对电力设备的健康水平及安全、质量、经济运行有关的重要参数性能、指标进行监测与控制,以确保其在安全、优质、经济的工作状态下进行。电站需要制定技术监督计划、确定试验项目、周期、试验标准、试验设备、人员资质以及风险点,执行过程中严格执行试验标准,如实技术监督试验报告,电站应保存技术监督试验报告,技术监督试验数据应与设计参数进行比较分析,并对电站设备及系统的安全性、可靠性等方面作出评价。

3.生产准备管理

生产准备工作是在施工期间对电站运营期所做的所有准备工作,主要在电站调试期间进行。电站运维人员提前介入工程调试阶段可以更深入的熟悉电站设备性能,故障历史,监督施工质量,在并网前及时提出并消除电站工程期间的施工问题。生产准备工作主要包含:生产准备计划编制、生产准备大纲编制、电站运行规程编制、电站检修规程编制、安装参与、调试参与、人员培训与授权上岗、上墙制度建立、设备台账建立、设备标牌制作、生产物资准备(如:法律规程采购、记录本、安全生产标识、工具、备件、耗材、劳保用品等)、技术资料收集和整理、设备交接准备工作、试运行工作、通讯网络和电话建设、生活区物资准备等。

4.移交接产管理

电站移交接产包含电站移交前准备、必备项排查、设备移交、厂房移交、运行移交管理、遗留项管理、移交现场安全管理、钥匙移交管理、文件移交管理、备件和工具(常用工具、专用工具、计量仪器)移交管理等内容;其中,遗留项管理是整个移交活动的难点,生产方和工程方需要明确遗留项处理的责任人和完成时间,对于不能按时完成消缺活动的工程单位,由施工尾款作为消缺的费用,消缺由生产方代为完成。移交前电站必须排查必备项,所有必备项合格后才可启动移交活动;验收合格的项目由生产方接管进入生产运营阶段。

5.生产保险和索赔管理

为了保障电站正常运行、减少因各种因素导致的电量损失或营业中断,建议电站购买生产相关的保险,主要购买险种有营业中断险、灾害险、设备质量险等,通过进行风险和经济分析选择购买的数额和种类;保险需要逐年足额购买,减少意外情况下的索赔风险,电站需要根据所购险种制定相应制度,保证意外情况下的索赔证据收集。

第五篇:运维管理各个流程

综合所学习的ITIL的相关知识,请从人员角度上进行分析,以事件管理、变更管理、配置管理和问题管理为例说说各管理流程中的人员角色及其职能。

答:1.事件管理流程

(1)服务台人员:负责接收所有的事件,对事件进行初步的处理,并根据实际情况将事件分派到合适的一线支持工程师。

职能:①在指定的响应时间内响应所有服务台热线电话、邮件、工单等事件报告;

②完整记录所有接收的事件信息,包括:记录事件报告人的详细联系方式、事件特征表现、描述、发生时间等;

③为事件进行适当的分类、为事件分配优先级等属性;

④尝试使用知识库、初步诊断、分析相关信息等方式解决事件;

⑤如果服务台不能解决事件,应当将事件分配给最合适的一线支持小组或来处理; ⑥检查事件记录的处理进度,保持与用户的联系,适时通知事件处理进展;

⑦在事件处理过程中,催办事件处理进度

⑧与用户确认事件解决方案及用户满意度反馈,关闭事件。

(2)一线支持人员:负责对服务台无法解决的事件进行快速有效的分析,提出解决方案以尽快恢复服务,并在必要时提供现场支持。

职能:①决定需要采取何种措施恢复服务并实施有效的行动

②必要时提供现场支持

③根据优先级提供有效的解决方案

④更新事件解决信息,已解决的事件转回服务台,由服务台关闭事件

⑤如果一线不能解决这个事件,应当决定选择最合适的二线支持小组/人员来处理

(3)二线支持人员:负责提供对一线支持人员无法解决的问题进一步进行调研,找出解决方案并尽快恢复服务。

职能:①进行事件的深入调查研究

②根据经验和专业技能,决定需要采取何种措施恢复服务并实施有效的行动③必要时引入供应商的支持

④及时提供有效解决方案

⑤与其他二线小组合作,确定解决方案

⑥已解决的事件转回服务台,由服务台关闭事件

(4)三线支持人员:

职能:①从研发的角度进行事件的研究

②根据经验和专业技能,决定需要采取何种措施恢复服务并实施有效的行动,如发布临时补丁等

③及时提供有效解决方案

④已解决的事件转回服务台,由服务台关闭事件

(5)事件经理:负责事件解决过程中的协调和监控,以及事件升级的判断以及具体执行。 职能:①负责对重大、紧急事件的解决协调资源,保证故障的最终排除

②当事件优先级为高或者事件将超过规定的时限,负责按照升级方法对事件进行处理确保有效协调资源,促进各类角色小组(如一线支持、二线支持)快速恢复正常服务

③确保和问题管理流程经理的有效合作

④确保正确和广泛地收集和分析事件数据,发现IT和业务相关的问题

(6)流程负责人:事件管理流程负责人从宏观上监控流程,确保事件流程在信息技术中心范围内被正确的执行。当流程不能够适应长期发展需要时,流程负责人必须及时的对此进行分析、找出缺陷、进行改进,从而实现可持续提高。

职能:①确定管理流程的衡量指标

②确保事件流程能够取得管理层的参与和支持

③确保事件流程符合企业实际状况和公司IT发展战略

④总体上管理和监控流程,建立事件流程实施、评估和持续优化机制

⑤确保事件流程实用、有效、正确地执行,当流程不能够适应公司的情况时,必须及时的对此进行分析、找出缺陷、进行改进(假如增加或合并流程的角色),从而实现可持续提高

2.变更管理流程

步骤:(1)启动、接受和分类:记录变更信息;鉴别变更影响;提交变更请求表格(RFC)

(2)评估和审批:从IT和业务观点上作出变更的评估和审批;批准或拒绝RFC

(3)计划和分派:建立变更计划;确定变更的实施日期;将变更分派到技术人员

(4)实施:最后实施的评估和审评/拒绝;根据变更计划实施;成功实施后作出记录;如果失败作出回撤

(5)关闭变更:检查实施是否成功;关闭FRC

(6)处理例外的变更

变更管理角色:

(1)变更管理流程负责人:变更管理流程解决方案的负责人,对于整个变更流程方案的结果承担责任,并有相应的权限

(2)变更经理:协调变更管理步骤的日常操作;

负责变更管理的质量,也是流程执行过程中的协调人,负责协调相关的资

源、作为变更流程与其他流程经理之间沟通的桥梁;

管理变更的日程安排

(3)变更请求者:表达变更的要求。提供初步的信息。验证变更的结构和提交RFC。

(4)变更受理者:变更请求的责任人,负责构建、测试变更,并制定实施计划、恢复计划等。(班组长或是部门经理)

(5)变更实施者:变更实施者,负责按照计划实施变更的内容(包括必要时的恢复步骤)。

(6)变更审批者:根据冲击评估,批准或拒绝RFC

3.配置管理角色:

(1)配置管理流程负责人 :是整个配置管理流程的责任人,对整个流程的成果负责,并拥有相应的权限.

(2)配置经理 :协调配置管理的日常操作活动,负责整个流程的质量和完整性。也是与其他流程经理的交流界面。

(3)配置管理员:负责配置管理数据的完整性和准确性,确保为其他操作管理提供准确的信息。

(4)配置报表负责人:基于标准的和特定的需求开发配置数据报表,并为配置管理的客户产生相关报表。

4.问题管理角色:

(1)问题记录人员:问题记录和分类将问题与现有事件关联并记录下来,以帮助划分问题解决方法的优先级。记录问题后,评估对业务的影响并确定解决方案的紧急程度。此评估确定问题的分类

(2)问题审查人员:问题调查和诊断,此过程处理问题的调查和对根本原因的诊断。根据数据来帮助问题管理团队评估解决问题的根本原因所需的资源和技能,包括对需要额外的规划、协调、资源和通信

(3)问题控制人员:问题的错误控制,更改 IT 组件或过程,解决影响 IT 基础结构的已知

错误,从而防止事件再次发生

(4)问题反馈人员:将问题最终解决方案反馈给服务台,并进行记录

本文来自 99学术网(www.99xueshu.com),转载请保留网址和出处

上一篇:英文歌曲比赛方案下一篇:业务经理个人简历