范文网 论文资料 服务运维管理系统技术(大全)

服务运维管理系统技术(大全)

服务运维管理系统技术第一篇:服务运维管理系统技术网首IT运维服务平台技术白皮书北京金商祺科技股份有限公司网首IT运维服务平台技术白皮书201207网首IT运维服务平台技术白皮书目录产品概述 。。。

服务运维管理系统技术

第一篇:服务运维管理系统技术

网首IT运维服务平台技术白皮书

北京金商祺科技股份有限公司

网首IT运维服务平台技术白皮书

201207

网首IT运维服务平台技术白皮书

目录

产品概述 ................................................................................................................................... 1

产品背景 ........................................................................................................................... 1 产品定位 ........................................................................................................................... 1 系统构架 ........................................................................................................................... 1 技术优势 ........................................................................................................................... 1 基础网络管理功能模块介绍 ................................................................................................... 2

拓扑自动发现与计算 ....................................................................................................... 2 拓扑管理 ........................................................................................................................... 2 拓扑展示 ........................................................................................................................... 3 网络设备管理 ................................................................................................................... 4 交换机端口状态管理 ....................................................................................................... 4 IPv6管理 ........................................................................................................................... 5 无线网AP监控与管理 .................................................................................................... 5 网络设备自动扫描发现功能 ........................................................................................... 6 批量修改和批量删除功能 ............................................................................................... 6 数据查询服务 ................................................................................................................... 7

已删除地址查询 ....................................................................................................... 7 按房间查询 ............................................................................................................... 7 按墙插编号查询 ....................................................................................................... 7 按IP地址查询 ......................................................................................................... 8 按MAC地址查询 ....................................................................................................... 8 按设备端口查询 ....................................................................................................... 9 查看路由表工具 ............................................................................................................... 9 查看ARP与FDB(MAC)表工具 ................................................................................... 9 IP与子网管理模块介绍 ......................................................................................................... 10 IP地址资源管理 ............................................................................................................. 10 子网使用情况统计 ......................................................................................................... 10 子网地址利用率排名 ..................................................................................................... 11 剩余地址段情况统计 ..................................................................................................... 11 IP地址使用情况统计 ..................................................................................................... 11 IP频繁变化排名 ............................................................................................................. 12 在线用户情况监测 ......................................................................................................... 12 交换机端口利用率统计 ................................................................................................. 12 网络流量监控与管理模块 ............................................................................................. 13 服务器监控与管理模块 ......................................................................................................... 13 服务器与应用自动扫描发现 ......................................................................................... 13 服务器监控与管理 ......................................................................................................... 13 服务器运行状态监控 ..................................................................................................... 14 服务器内部监控 ............................................................................................................. 14 监控与告警模块 ..................................................................................................................... 14

网首IT运维服务平台技术白皮书

邮件告警 ......................................................................................................................... 14 短信告警 ......................................................................................................................... 15 设备告警日志查询 ......................................................................................................... 15 ARP监控与告警 ............................................................................................................. 15 延时与丢包实时监控功能 ............................................................................................. 16 链路流量TOP10监控 .................................................................................................... 16 端口流量实时监控功能 ................................................................................................. 17 收发包错误监控 ............................................................................................................. 17 自定义监控图 ................................................................................................................. 18 运维管理模块 ......................................................................................................................... 18 运维事件类型管理 ......................................................................................................... 18 事件管理 ......................................................................................................................... 19 运维数据统计分析 ......................................................................................................... 19 网络设备配置自动备份功能 ......................................................................................... 19 知识库管理 ..................................................................................................................... 19 报表查询管理 ................................................................................................................. 20 机房环境监控与布线管理 ..................................................................................................... 21 园区、建筑、机房管理 ................................................................................................. 21 配线信息管理 ................................................................................................................. 21 机柜管理 ......................................................................................................................... 22 机房拓扑 ......................................................................................................................... 22 机房环境监控与管理 ..................................................................................................... 23 视频监控管理 ................................................................................................................. 25 资产管理 ................................................................................................................................. 25 项目与合同管理 ............................................................................................................. 25 资产管理 ......................................................................................................................... 25 SYSLOG汇总分析模块 ........................................................................................................... 26 SYSLOG实时采集过滤查询............................................................................................ 26 日志归档保存 ................................................................................................................. 26

网首IT运维服务平台技术白皮书

产品概述

产品背景

随着互联网和计算机技术的发展以及信息化建设步伐的不断加快,各行业都开始大规模的建立和使用网络,并且越来越多的单位对网络办公、各种在线的信息管理系统的依赖程度不断增加。网络的使用者不仅仅是在数量上增长迅速,同时对网络应用的需求也更加多样化,因此网络的运维和管理比以往任何时刻都显得更加重要。如何才能高效的运维和管理网络成为各个单位网络或者IT部门面临的一个难题。

产品定位

网首IT运维服务平台正是为了解决在产品背景中描述的问题而设计和开发的。系统包含了网络设备管理、服务器与应用管理、监控与告警管理、网络运维调度管理、机房与布线管理、机房环境监控、资产管理等几个模块,将以往需要人工或者从多个不同渠道和系统收集的信息通过一个系统进行整合;同时系统提供的协同工作平台使得网络管理人员之间的信息传递?共享?的有效性大大增强,将以往各种复杂的网络管理工作简单化、自动化,在极大的提高网络管理的效率同时提高网络服务的质量。

系统构架

网首IT运维服务平台采用基于64位Linux操作系统以及mysql数据库进行开发,采用纯粹的B/S构架(不需要安装第三方插件或者java虚拟机、兼容各种主流浏览器,包括手机浏览器);WEB展现部分与业务逻辑分离,用户可以自己定制WEB界面;支持分布式数据采集;采用基于角色和分组的权限管理方式,用户可以根据自己单位的管理模式任意制定角色和分组,从而做到权限的横向纵向的任意划分。

技术优势

1. 支持不同厂商的设备

不仅支持思科、华为、H3C、锐捷、神舟数码、中兴、juniper、extreme等厂商的网络设备,同时支持allot、acenet等厂商的安全流控设备。 2. 高可靠性、高稳定性、高安全性

基于Linux操作系统和mysql数据库,不用担心病毒与升级打补丁的麻烦;支持https,保证数据的传输安全。 3. 高性能

基于64位操作系统开发,优化系统配置和自定制内核,发挥64位的最大优势 4. 用户、角色、权限自定义

1

网首IT运维服务平台技术白皮书

采用基于角色和分组的权限管理方式,用户可以根据自己单位的管理模式任意制定角色和分组,从而做到权限的横向纵向的任意划分。 5. 对IPv6具有良好的支持

系统可以在IPv4和IPv6双栈方式下运行,也可以在纯IPv6网络上运行。可以监测用户的IPv6使用情况以及统计数据。 6. 对服务器的监控采用被动方式

对服务器监控不需要在服务器上进行任何的设置,系统根据服务器对外提供服务的情况依据协议规定进行外部探测。

7. 整合资产管理和工作流事件处理

对网络设备管理的同时增加资产管理和统计报表功能,使得对设备使用情况有更好的了解,网管结合工作流处理提高效率。 8. 整合机房环境监控与布线管理模块

采用自行设计开发的传感器通过网络对机房、配线间的环境(温度、湿度等)进行实时控和数据记录、结合系统告警功能对环境变化进行实时告警,将布线系统和网管系统结合,提高网络管理的效率。

基础网络管理功能模块介绍

拓扑自动发现与计算

系统支持自动拓扑发现功能,可以进行二层和三层设备的拓扑自动发现,同时对思科设备支持CDP算法拓扑发现。

拓扑管理

可以根据网络的具体情况和用户的使用习惯任意定义网络拓扑图,将任意区域的网络设备放置到一个定义好的拓扑中进行展现。

2

网首IT运维服务平台技术白皮书

拓扑展示

使用flex对拓扑信息进行实时展示,动态显示拓扑中每台交换机当前的状态,每条链路的双向流量,并且用不同的颜色区分链路带宽的使用情况,根据用户定义的告警级别阀值给出告警信息。

通过拓扑图可以选择查看交换机的各种信息,包括端口信息、配线信息、端口状态、用户情况等;如果拓扑图中设备的下级设备(没有显示在本级拓扑中)出现故障,也会在当前拓扑中得到告警体现,同时可以直接从本级拓扑展开到下一级拓扑中。

3

网首IT运维服务平台技术白皮书

网络设备管理

可以查看交换机IP地址、描述、厂商、类型、当前状态、在线用户、端口状态、链接关系等信息,也可以直接通过IP查找交换机。

交换机端口状态管理

可以查看被管理交换机的端口列表,包括该交换机所有的物理端口的端口名称、MAC地址、当前的管理状态、当前的链接状态、链接速率、当前该端口下链接设备的设备的MAC地址情况以及历史上曾经出现在该端口的上的MAC地址使用情况、与该端口互联的设备的IP地址,如果是接入层设备会显示该端口接入的建筑物与房间号等信息。

4

网首IT运维服务平台技术白皮书

IPv6管理

对网络设备中支持IPv6的三层设备可以开启IPv6管理与监控功能,实时收集网络中IPv6地址的使用情况,包括用户的IPv6地址,与其对应的MAC地址,所在交换机端口,结合布线信息可以直接定位IPv6用户所在房间等信息。

无线网AP监控与管理

随着网络的发展,无线网在日常工作中的地位越发显得重要,很多单位已经实现了大面积的无线网络覆盖,但是对于无线AP的监控和管理一直处于空白状态。本系统提供了对无线AP监控的方式,用户可以对网络中AP的在线状态进行监控,如果采用POE方式还可以设置对故障AP实施自行重启。系统设计专门针对目前主流的瘦AP+控制器的方案,有效的解决了瘦AP的IP地址不固定等影响监控的问题。

5

网首IT运维服务平台技术白皮书

网络设备自动扫描发现功能

可以对指定的IP地址或地址段的设备进行批量扫描和初始化,自动识别该地址段内的设备信息,包括设备的厂商、型号、端口信息等。本功能支持并发操作,并且用户可以根据服务器的性能自己定义并发数据大小,极大的提高了扫描效率,节省初始化时间。

批量修改和批量删除功能

为了方便用户操作,系统支持对交换机进行批量修改和删除操作,可以对指定的交换机进行二次筛选,对需要修改的项进行批量的修改或删除。

6

网首IT运维服务平台技术白皮书

数据查询服务

在建立了完备的网络和设备信息档案以后,就可以在日常维护工作中大大的提高工作效率。对于管理员来说,日常维护中大量的工作内容就是故障的排除和维修,通过系统这里提供的数据查询功能,就可以实现故障点的快速识别、定位和对故障原因的初步判断识别。

已删除地址查询

所谓已删除IP是指该IP地址以前在某个设备上被使用过,后来由于设备调整,该IP被释放掉了,但是系统中仍然会记录着原来使用这个IP地址的设备的日志信息,是可以通过该模块查询出来的。

按房间查询

在日常报修事件中,更多的情况是某个人说自己所在的房间无法上网了,这时就需要根据其所在位置来查找问题的原因。在本模块中,可以根据具体的房间信息来查询设备和连接状态。然后逐步排查问题的所在。

按墙插编号查询

当某个房间内的用户报修说自己的电脑无法上网时,如果连接其电脑的网线插入的墙插有编号信息,也可以根据墙插编号来查询该节点的设备和连接信息。

通过输入建筑物信息和墙插编号,可以查看到该墙插连接的接入交换机信息,以及对应的设备端口上的当前和历史访问记录。

7

网首IT运维服务平台技术白皮书

按IP地址查询

该功能很适合用来追查恶意访问者行为,如果某个人通过某个地址发表了不良言论或者是从事了违法行为,可以通过其访问服务器时的IP地址,追查到使用者的方位。

按MAC地址查询

很多单位由于大量使用无线接入点,所以会有通过DHCP方式获取地址的大量终端,这时候由于IP地址不固定,使得我们在追查某个设备行为的时候只能依赖其设备MAC来定位。

8

网首IT运维服务平台技术白皮书

按设备端口查询

当检测到某个设备的端口流量发生异常的时候,么可以通过查询交换机的特定端口,查询出该端口接入点和当前以及历史的接入信息,有助于排查发生流量异常的原因。

查看路由表工具

可以通过系统直接查看三层设备的路由表,包括网络地址、子网掩码、路由类型、下一跳地址。

查看ARP与FDB(MAC)表工具

可以通过系统直接查看设备的ARP表与FDB(MAC)表,并且可以根据MAC地址将两张表自动关联,直接显示IP、MAC、二层设备端口的对应关系。

9

网首IT运维服务平台技术白皮书

IP与子网管理模块介绍

IP地址资源管理

随着网络规模的不断扩大,网络管理部门要应对的不仅仅是网络设备的增加,同时也要管理更多的IP地址与子网,对于大量的IP地址分配和子网的划分需要有一套高效的信息系统进行管理,该模块就是针对这个应用场景进行设计的,提高IP与子网的管理效率。

子网使用情况统计

可以自动发现网络中划分的子网信息,包括网络地址、子网掩码、三层设备地址、VLANID、可用的IP地址数、当前子网内使用的IP地址数、历史上曾经使用的IP地址情况等信息;同时可以增加管理员自己维护的信息,如分配情况等。

10

网首IT运维服务平台技术白皮书

子网地址利用率排名

可以按照每个子网当前或者历史的地址利用率进行排名,使得管理人员更容易了解每个子网的IP地址使用情况。

剩余地址段情况统计

根据用户可以使用的子网信息以及系统扫描到的子网信息自动计算剩余的IP资源,并且以聚类后的形式给出。

IP地址使用情况统计

可以对一段IP地址的使用情况用图表的方式进行显示,显示本段地址中正在使用的和从未使用或者是曾经使用过的IP。

11

网首IT运维服务平台技术白皮书

IP频繁变化排名

如果一个IP地址在很短的时间内经常在不同的交换机端口变动或者使用该IP的主机的MAC地址不断的变化说明存在IP冲突或者IP地址不够的情况,系统可以自动监控全网此类IP异动,为网络管理人员及时发现问题提供了一个良好的工具。

在线用户情况监测

可以实时监控和记录整个网络的用户使用情况,使得管理者清楚在不同的时间段网络用户数量的变化。

交换机端口利用率统计

可以根据时间、建筑物、交换机等统计交换机端口使用情况,并且按照使用率高低进行排序,使网络管理者及时有效的掌握交换机端口使用情况。

12

网首IT运维服务平台技术白皮书

网络流量监控与管理模块

系统可以自动监控收集拓扑中交换机各条链路的流量信息,支持按照日、周、月、年进行流量图绘制,支持链路汇聚。

服务器监控与管理模块

服务器与应用自动扫描发现

可以通过对给定IP地址范围内的服务器进行扫描,发现服务器以及服务器上的标准应用,如FTP、WEB、telnet等。

服务器监控与管理

对网络中心管理或者在网络中心托管的服务器进行监控和管理,包括对IP地址分配,服务器运行状况、服务器描述、操作系统、管理员、服务器配置等信息进行管理。

13

网首IT运维服务平台技术白皮书

服务器运行状态监控

通过flex实时监控服务器的运行状态以及服务器上应用的的运行状态,可以实时展示服务器当前的运行情况。

服务器内部监控

通过配置服务器SNMP协议可以更深入的了解服务器的运行情况,包括服务器的CPU利用率、内存使用率、磁盘IO情况、网络流量情况等信息,并且可以根据信息画出跟踪图表,使得监控效果更加清晰。

监控与告警模块

邮件告警

系统支持邮件方式进行告警,可以设置邮件服务器,然后针对设备和告警级别选择对应的告警邮件接收用户。

14

网首IT运维服务平台技术白皮书

短信告警

系统支持短信告警,既支持网络发送短信,也支持将短信模块直接挂载在服务器上使用,既节约了短信成本又提高了短信发送的可靠性。

设备告警日志查询

系统会记录各种设备的告警日志信息,提供按照IP地址和时间段进行查询的接口,使得用户更好的定位各种设备告警。

ARP监控与告警

系统会实时监控交换机当前的ARP表,对于一个MAC同时占用大量IP的设备进行监控,同时直接定位该主机所在位置,对于网络管理人员对ARP攻击和欺骗的追查提供了便利的手段。

15

网首IT运维服务平台技术白皮书

延时与丢包实时监控功能

可以对网络的重要节点(重要的路由器、服务器、监控点)的延时(ping的响应时间)和丢包率做实时监控,设定告警门限值,当丢包率或者延时超过门限值时自动告警,并且可以将系统的记录以图表的形式展现,有助于用户对网络基础数据的掌握。

链路流量TOP10监控

可以对每条链路的流量情况按照绝对值大小和使用比例两种发方式排序,给出流量最大或者是使用率最高的前10条链路,使用户很容易找到网络带宽的瓶颈所在。

16

网首IT运维服务平台技术白皮书

端口流量实时监控功能

对于交换机出现异常,如CPU利用率居高不下、转发能力下降等情况,传统的处理方法一般是对交换机端口进行折半关闭处理,既浪费时间也难准确的定位出问题的端口。本系统提供了一种全新的方式处理此类事件,将关注交换机端口的数据按照一定的次序排序展现给管理人员,可以有效的帮助判断出问题的端口。

收发包错误监控

由于设备接口老化或者线路老化以及介质接触等原因会使得设备在互联端口上出现收发包错误的情况,这种情况通常很难被发现,但是却严重影响网络质量。系统提供了一个全自动监控全网链路收发包错误的功能,可以时刻查看存在收发包错误的端口,同时可以查看端口收发报错误的历史数据。

17

网首IT运维服务平台技术白皮书

自定义监控图

可以根据用户关注的重点任意组合端口的流量图、节点的延时丢包率统计图、传感器温湿度监控图或者其他图表到一个自定义页面做统一的展示和监控。

运维管理模块

运维事件类型管理

可以根据网络运维需要处理和应对的事件自行定义类型,系统根据事件类型自动分类汇总事件的统计结果。

18

网首IT运维服务平台技术白皮书

事件管理

系统用户可以根据业务流程添加日常运维事务,事务可以由添加的用户直接处理,也可以转交其他用户处理。

运维数据统计分析

可以将历史运维数据进行分类汇总和统计分析,从而了解运维的整体状况,与系统监控告警结合可以更好的为网络建设提供可靠的依据。

网络设备配置自动备份功能

可以根据用户定义的策略(每天、每周等)自动备份网络设备的配置文件,并且可以从网管系统直接选择相应设备的配置文件推送到用户桌面,可以大大节省用户对网络设备配置备份付出的人力成本,也避免了由于用户疏忽造成的修改配置不能及时备份的错误。

知识库管理

面对日趋复杂的IT应用,多种多样的IT需求,如何提供高品质的IT运维支持,成为众多企业关注的核心问题。很多的运维问题都可以通过知识库中已有的内容得到解决。系统提供了一套完整的知识库体系,可以根据自己运维的方式和内容自定义知识库结构。可以按照分类和内容方便的检索知识库内容,支持各种格式的附件功能。

19

网首IT运维服务平台技术白皮书

报表查询管理

通过查看报表的功能,可以对全局流量进行某时间段的流量总量统计查询,让管理人员更直观、更清楚的知道各部分网络的流量情况。报表种类丰富,包含了交换机CPU、服务器、传感器、告警的报表。

20

网首IT运维服务平台技术白皮书

机房环境监控与布线管理

园区、建筑、机房管理

系统可以根据用户网络的实际情况分别按照园区、建筑、机房、机柜、配线架进行系统的管理,也可以定位每个设备和接入点的具体位置。

配线信息管理

系统可以按照配线间、机柜、配线架管理配线信息,配线信息可以和交换机网管系统联动快速定位接入点位置和接入交换机情况。

21

网首IT运维服务平台技术白皮书

机柜管理

可以按照机柜的实际位置显示机柜中的设备、并且可以打印机柜装配图,设备状态与网管系统联动,可以准确的定位设备位置和了解设备运行状态。

机房拓扑

可清楚地展现个机房运行情况、机房间光纤连接情况等。为机房改造、搬迁提供清晰的数据。

22

网首IT运维服务平台技术白皮书

机房环境监控与管理

结合自主开发的网络传感器可以对机房环境进行监控,传感器体积小、成本低,可以在所有设备间进行部署,数据通过网络传递回系统,与系统自带的告警系统结合完美的解决了机房环境(温度、湿度等、电流、电压)监控的问题。

IPS-1020是一款业内领先的网络温湿度传感器。它支持TCP/IP协议,由内部的webserver在多个端口上向用户提供服务,用户可以使用浏览器轻松地更改传感器的IP,查看当前的温湿度信息等。IPS-1020支持专业的SNMP协议进行传感器管理,可以通过标准的SNMP协议获取传感器各项监控值。IPS-1020还通过点阵液晶显示面板,实时显示当前的温湿度及IP地址。此外,IPS-1020还拥有大量的外扩资源:多速率的RS232,RS485及TTL电平的串口,SPI、I2C及GPIO接口使得IPS-1020可以轻松地面对各个场合的使用。

23

网首IT运维服务平台技术白皮书

 温度测量范围:-40℃ ~ 85℃  温度测量精度:±0.5℃  湿度测量范围:010/100M自动识别,支持Auto-MDIX  网络协议:TCP,UDP,IP(支持动态更改IP),ARP,ICMP,DHCP,HTTP(使用浏览器访问IP即可显示当前温湿度或修改IP),SNMP(支持通过SNMP获取当前温湿度指标))  串口电平:RS232,RS485,可对外5V供电,单DB9公接头集成,协议可定制  串口速率:1200 – 115200 bps  供电电压:5V 500mA  外形尺寸:10CM * 10CM * 3CM

24

网首IT运维服务平台技术白皮书

视频监控管理

根据需要,在机房区配置IP摄像头,以便管理人员可以实时监视机房情况,亦可根据需要设置录像。

资产管理

项目与合同管理

可以依据对项目申报、审批、签订合同、设备到货的的记录,管理项目从申报到验收的整个过程,以及对项目合同产生的资产进行跟踪。

资产管理

可以自定义资产分类,并且根据不同的分类进行扩展,支持资产的批量添加和导入,可以直接从在线设备列表中导入交换机和服务器等资产,与网管、机房设备间管理联动可以有效的掌资产的使用情况。

25

网首IT运维服务平台技术白皮书

SYSLOG汇总分析模块

SYSLOG实时采集过滤查询

启用该功能后可以将支持SYSLOG的设备的日志指向本系统,系统会根据用户定义的关键子进行过滤和分析,并且可以按照IP、时间、关键字等查询日志。

日志归档保存

对于网络规模较的的系统,可以按照IP和时间将历史的日志归档,方便以后分类查询,并且大大降低了存储开销。

26

网首IT运维服务平台技术白皮书

27

第二篇:运维服务质量管理制度

1 目的

为确保公司提供的运维服务满足客户所需的服务质量,寻找公司服务实施过程中存在的问题和缺陷,为服务改进活动的有效实施提供目标和方向,保证组织的服务质量稳定可控并持续提升,特制订本制度。

2 适用范围

本过程适用于运维服务实施全过程的检查与审计。

3 职责 3.1 公司高层

(1)负责审批年度服务管理计划。

(2)定期对服务实施过程进行监控和管理,对服务实施过程的改进进行审批。

(3)负责公司运维服务体系的管理评审,以确保运维服务能力的适应性和有效性。

3.2 质量管理部

(1)负责公司运维服务体系的定期内部评审,对内审中不达标项的处理进行跟踪记录。

(2)负责运维服务的组织级质量保证。 (3)对公司运维服务业务的质量进行监控。 (4)负责组织级客户满意度的调查。 (5)负责改进措施的监督及检查。

3.3 技术服务中心

(1)全面管理公司运维服务业务,负责制定总体的服务质量管理计划。 (2)监控运维服务质量, 定期组织质量分析会议,对运维业务开展情况进行评估。

(3)对重大投诉进行原因分析、处理和回访。 (4)对每年运维服务报告进行审查。

3.4 运维服务部

(1)负责对所管辖的业务质量计划的制定。

(2)负责对所管辖的业务进行质量控制,对质量管理部和服务台提供的客户服务质量调查结果进行分析和处理。

(3)定期组织召开质量分析会。 (4)跟踪客户投诉的处理过程。

(5)定期编写总结报告,持续改进完善维护服务能力和质量。

3.5 服务台

(1)负责监控服务的处理过程。 (2)对每个处理事件进行客户回访。

(3)接收和处理客户投诉,重要的客户投诉信息及时反馈给相关部门处理。

(4)负责保证备品备件供应的及时性和完好性。 (5)负责服务数据的统计,并报送给相关部门。

3.6 运维服务人员

包括项目经理、技术支持工程师、现场工程师等相关人员,按照运维岗位职责的要求、工作流程及质量要求,实施具体运维服务任务,并将过程形成记录。

4 质量管理内容 4.1 高层的质量管理活动

(1)制定管控指标:根据市场情况、技术发展和公司自身变化,制定并周期性的评审公司运维业务的方针策略和目标,评审服务目录、管控目标,评审组织结构和管理制度

(2)管理评审:管理评审的目的是通过对公司服务体系运行的适宜性、充分性和有效性进行评价,确定公司服务体系的改进方向。

(3)服务改进规划:根据市场情况、技术发展和公司自身变化,周期性

3 的评审服务工作中存在的问题,并评估批准整改措施;评审现有流程执行的差距和改进措施,更好地适应服务需求;通过服务改进管理,提高运维服务工作的适应性和管理水平。

4.2 质量管理部的质量管理活动

(1)组织级质量月报:通过定期或事件触发地收集组织内所有服务项目的质量情况,进行汇总分析形成质量月报,并送达到组织内所有相关人员(包括高层管理人员)。

(2)服务质量管控指标的分析:通过阶段性(月度、季度)的服务工作总结,对公司服务业务发展过程的问题和偏差做出有效评估,提出改进措施和建议。

(3)内审和管理评审:公司质量管理部负责组织每年一到两次的内审和每年一次的管理评审,来评价公司的运维服务能力的适应性和有效性。

(4)客户满意度调查:公司质量管理部负责每年一次对客户进行满意度调查,并对调查结果进行分析和总结,对相关的调查结果进行分析,及时反馈给相关部门和责任人,对重大质量问题进行跟踪和督促。

4.3 运维部门的质量管理活动

(1)签订服务协议:运维服务部门经理协助销售部门与客户签订服务级别协议SLA(或包SLA服务合同)。

(2)质量计划:运维服务部门经理或项目经理制定服务项目的质量保证计划,以确保服务目标的实现,服务风险的降低。

(3)服务执行:从项目开始实施至结束,项目经理监督、控制服务过程中的每一个环节,包括事件、配置、变更、发布、信息安全,按合同要求形成服务报告,在报告中详细列明SLA达成情况。服务台管理员及时回访客户,调查服务满意度。

(4)质量分析:运维服务部门经理对本部门的各项目质量进行管理,包括数据统计、分析、预警、跟踪。检查各项运维服务指标达成情况,并与SLA的要求进行对比,对未达标项提出改进措施,形成项目质量分析报告。

(5)质量改进:由技术服务中心总经理组织相关人员,通过阶段性(月度、季度)的服务工作总结,对公司服务业务发展过程的问题和偏差做出有效评估,并进行调整和优化,及时了解客户的需求,并根据客户的意见或建议进行改进,保证年度运维服务目标的实现。

5 运维服务质量管理要求 5.1 客户满意度调查要求

(1)客户满意度调查工作由服务台和公司质量管理部完成,其中,服务台负责项目级客户满意度调查,质量管理部负责公司级客户满意度调查。

(2)项目级的客户满意度调查是对每个已解决的事件在24小时内进行电话回访,确认工程师是否成功解决问题,了解客户对处理结果的满意度。

(3) 公司级客户满意度调查应每年最少进行一次,采用问卷填写,客户满意度调查内容必须与SLA(或服务合同)内容相一致,应注意调查样本的比例及覆盖范围,以降低抽样的风险。

5 5.2 项目的质量管理要求

(1)项目经理必须严格按照SLA(或服务合同)的要求,为客户提供运维服务。同时及时监控服务过程,以确保达到SLA的要求。并定期向客户和部门总经理提交服务报告。

(2)服务台管理人员及时对已完成的项目进行客户回访,以获取客户的满意度评价,同时形成满意度报告提交给部门总经理。

(3)服务台经理根据SLA(或服务合同)制定指标体系,按月进行指标统计,形成质量报告,报送给相关部门及项目经理。

(4)运维部门经理每月须召开一次质量分析会,回顾和总结月度质量计划完成情况,提出下阶段的改进措施,并对相关人员进行指标考核。

5.3 体系的质量管理要求

5.3.1内审要求

(1)内审要求每年度执行一到两次,安排在每年年中、年底进行,可根据公司实际情况策划审核频次。由IT运维质量部来负责组织内审计划、实施和报告,但必须得到管理者代表的批准。

(2)内审的范围是运维服务涉及的所有部门,包括运维服务的主要实施部门和支持部门。内审要对GB/T 28827.1-2012中人员、资源、技术和过程都进行审核。

(3)内审需要制订内审计划、检查表,内审员在审核过程中要详细记录审核内容;审核完成后需要对不合格项进行整改;编写内审报告。 5.3.2管理评审要求

(1)管理评审要求每年必须执行一次,由管理者代表组织实施。 (2)管理评审的参加人员要包括:公司领导、管理者代表、各运维服务部门的负责人、质量部负责人、人力资源部负责人、财务部负责人、运维管理体系负责人、技术研发负责人、行政负责人等。

(3)管理评审的主要内容为:年度能力管理计划的实施情况汇报、各项KPI的完成情况、客户满意度调查汇报、各运维服务部门的工作汇报、运维服务管理体系内审报告、客户投诉报告、持续改进情况等。

3.2.4 管理评审需要先制定管理评审计划,收集相关材料,根据管理评审结果制定管理评审报告,如果在管理评审上发现问题,需要对问题进行跟踪、

6 相关文件

《月度总结报告》 《内部审核报告》 《管理评审报告》 《客户满意度调查表》

7 支持规程

 运维服务实施方案  服务能力管理改进计划  服务级别管理程序  服务报告管理程序

7  事件管理程序  问题管理程序  配置管理程序  变更管理程序  发布管理程序  信息安全管理程序  知识库管理程序  备品备件管理规定  客户沟通机制

第三篇:系统运维驻场服务

为确保甲方相关设备完好,运转正常,驻场技术服务包括规范性日常维护,故障应急响应,设备问题解决等范围,具体工作内容如下:

一、设备应用

1、负责对所有设备(详见附件1)的应用操作,每季度提交每个设备的配置和存储应用情况报告、网络拓扑报告、IP分配报告,并负责对上海海事局航海图书印制中心的相关工作人员进行培训;

2、对新应用的设备需求,驻场工作人员应及时提交设备配置现状及设备规划报告,以便该应用能及时实施;

3、掌握设备的运行情况,就保修期、存储空间等及时进行提醒;

4、建立相关系统软件各种故障的恢复流程及应急措施;

5、协助印制中心进行机房改造、设备搬迁、网络改造等工作。

二、环境与设备

1、指派专人定期对机房供配电、空调、温湿度控制等设施进行检查记录;

2、指派专人对机房人员的出入、服务器的开机或关机等工作进行记录;

3、按照合同附件资产清单,建立服务器及网络设备的档案,形成不易破坏的醒目标识,并定期更新相关内容;

4、对资产清单所列的各种设备、线路等,做好检查维护工作,发现故障,及时报告,并安排服务联系或维修,对维修情况提交书面报告;

5、对资产清单所列的各种设备、线路运行及维修记录,按重要性级别,定期书面报告;

6、形成每日巡视制度,对机房中相关设备的告警显示、空调、UPS等实际状态进行记录。

三、监控和安全

1、通过IT资源监控系统,对通信线路、主机、网络设备和应用软件的运行状况、网络流量、用户行为等进行监测和报警,形成记录、妥善保存并按重要性级别,定期书面报告;

2、指派专人期对监测和报警记录进行分析、评审,发现可疑行为,形成分析报告,并采取必要的应对措施;

3、指派专人,负责网络运行日志、网络监控记录的日常维护和报警信息分析和处理工作,提出优化建议及方案;

4、根据厂家提供的软件升级版本对网络设备进行更新,并在更新前对现有的重要文件进行备份;

5、定期对网络系统进行漏洞扫描,对发现的网络系统安全漏洞进行及时的修补;(甲方配置相关硬件设备后实施)

6、对关键的网络设备服务配置文件进行定期离线备份;

7、定期检查违反规定上网或其他违反网络安全策略的行为,书面报告;(甲方配置相关硬件设备后实施)

8、指派专人进行核心服务器的工作压力监控,针对业务的增长定期生成主服务器的工作压力报表,并且预估业务增长对服务器压力的影响提出合理化建议;

9、指派专人进行核心数据库的工作压力监控,定期生成报告,并就改进提出合理化建议。

四、操作系统安全

1、根据甲方业务需求和系统安全分析结果,确定系统的访问控制策略;

2、定期进行漏洞扫描,对发现的系统安全漏洞及时进行修补;

3、对小型机进行安全加固,提升操作系统安全性。在不影响数据库工作性能的前提下,打开安全选项进行安全加固。

4、及时安装系统的最新补丁程序,在安装前,首先报告同意,且在测试环境中测试通过,并对重要文件进行备份后,方可实施系统补丁程序的安装;

5、所有对系统进行的维护,均需详细记录操作日志,包括重要的日常操作、运行维护记录、参数的设置和修改等内容,严禁进行未经授权的操作;

6、定期对运行日志和审计数据进行分析,以便及时发现异常行为;

7、认真学习系统管理员角色要求,明确权限、责任和风险。

五、备份与恢复

1、根据印制中心实际应用情况、根据生产相关数据的连接关系、根据应用的业务特点和软硬件资源,制定详细的系统数据备份计划,确定合理的系统备份策略。定期备份重要业务信息、系统数据及软件系统等;

2、应根据数据的重要性和数据对系统运行的影响,执行数据的备份,每月提交数据备份报告,必要时实施数据恢复;

3、按照控制数据备份和恢复过程的程序,对备份过程进行记录,所有文件和记录应妥善保存;

4、按要求,定期执行恢复程序,检查和测试备份介质的有效性,确保可以在恢复程序规定的时间内完成备份的恢复;

5、定期进行备份介质的维护、更新、替换、轮转,保证备份介质可靠有效,针对重要备份介质进行双机房异地轮转;

6、制作备份和恢复的测试过程手册,最大地提高工作效率。

六、安全事件处置

1、及时报告所发现的安全弱点和可疑事件,但任何情况下均不应尝试验证弱点;

2、在安全事件报告和响应处理过程中,分析和鉴定事件产生的原因,收集证据,记录处理过程,总结经验教训,提供防止再次发生的补救措施,过程形成的所有文件和记录均应妥善保存。

七、服务报告及工作流程整理

1、上述工作内容中要求提交的书面报告之外,驻场人员提供的报告包括: 序号报告报告方式频度1事件处理报告格式文档(邮件)事件发生时2巡检报告格式文档(邮件)每日3月工作报告格式文档(邮件)每月4季度服务报告格式文档(邮件)每季度

2、上述工作内容,驻场人员应及时整理汇总相关操作流程,形成作业指导文档,定期上交。

第四篇:IT运维管理咨询服务

什么是IT运维管理

IT运维管理,是指单位IT部门采用相关的方法、手段、技术、制度、流程和文档等,对IT 运行环境(如硬软件环境、网络环境等)、IT业务系统和IT运维人员进行的综合管理。

为什么要做IT运维管理

IT运维管理是时下IT界最热门的话题之一。随着IT建设的不断深入和完善,计算机硬软件系统的运行维护已经成为了各行各业各单位领导和信息服务部门普遍关注和不堪重负的问题。由于这是一个随着计算机信息技术的深入应用而产生的新课题,因此如何进行有效的IT运维管理,这方面的知识积累和应用技术还刚刚起步。对这一领域的研究和探索,将具有广阔的发展前景和巨大的 现实意义。

怎么实施IT运维管理

【明确组织目标】

一个组织必须有明确的既定的目标,任何管理系统都应有明确的目标,目标不确定,或者混淆了不同的目标,都必然会导致管理的混乱。任何管理活动都必须把制定目标作为首要任务。 【明确职责与分工】

 可以最大限度地实现劳动用工的科学配置;  有效地防止因职务重叠而发生的工作扯皮现象;  提高内部竞争活力,更好地发现和使用人才;  是组织考核的依据;

 提高工作效率和工作质量;  规范操作行为;

 减少违章行为和违章事故的发生。 【明确工作流程】

宏伟的战略和目标只有真正落实在流程上面,才是真正开始执行的战略。企业在做了总的战略部署之后还要做分领域的业务战略,然后细分到市场、研发、生产,一直分解到具体的活动。流程是落实战略执行的关键,流程就是执行力。 【明确考核机制】

从企业经营目标出发进行评价,并使评价和评价之后的人事待遇管理有助于企业经营目标的实现。运用一套系统的制度性规范、程序和方法进行评价。对组织成员在日常工作中体现出来的工作能力、工作态度和工作成绩,进行以事实为依据的评价。 【流程固化】

流程固化并不是简单的将流程图贴在墙上,告知员工就可以达到目的。很大一方面,需要管理的手段与合理的方式加以辅导,才能够使流程真正的落地和固化。“习惯是最顽固的敌人”积累多年的工作方式和习惯,会成为流程固化所要面对的第一道前菜,流程固化,是两只手,“硬件与软件”结合的新的工作方式形成的过程。

上海天帷IT运维管理

运维服务方面通过引入ITIL V3全生命周期管理的框架及服务理念,在开展运维服务的同时进行,以服务战略为核心,设计提供客户真正所需的服务产品,通过专业的服务支持计划、服务流程和服务支持资源,确保服务运营的稳定和可靠,同时不断改进和完善。

第五篇:用电信息采集系统运维服务报告

一、

用电信息采集系统(以下简称采集系统)承担着用电信息自动采集、高效共享和实时监控的重要任务,是.智能用电服务体系的重要基础和用户用电信息的重要来源。系统经过近三年建设,已投入大规模应用,城区用户已实现全覆盖,开始向乡镇延伸,抄表率等指标也纳入同业对标考核体系。随着系统的大规模建设,系统的运维服务工作将是建设后期的重点。

二、系统运维现状及问题

当前建设的采集系统主要是将智能电能表、集中抄表终端作为系统的底层基础设施,以低压电力载波、微功率无线、RS-X185 , GPRS/CDMA、光纤专网等为主要通信载体,结合先进的控制手段和软件技术,对电力用户的用电信息进行采集、处理和实时监控的系统。初步统计截止目前国家电网28个直属省公司均已建成用电信息采集系统,己安装智能电能表约1. 1亿只,在运行集中抄表终端(指集中器和专变终端)约百万只。如此庞大的系统,如何保障它可靠、稳定的运行,将是后期工作重点。在当前的运维工作中主要存在如下问题:

1、 缺乏专业化的维护队伍

采集系统由于其资源技术的特有和保密性,在现阶段调试和售后维护基本依靠各供应商来完成,运维工作内外部的定位和分工不是很明确,虽有供应商承担一部分工作,但因为成本和责任的问题易出现内外部维护人员积极性不高、相互推谱、相互依靠的问题。导致服务质量不高,内部人员技术掌握不深入、不全面,而且从人员结构上来说,无相应的岗位设置或相应岗位缺乏专业人员,缺乏一支具备系统和专业知识的运维队伍。

2、运维工作缺乏系统性

采集系统属于集成系统,整个系统涉及的供应商多且分散,在进行运维服

一、前言

用电信息采集系统(以下简称采集系统)承担着用电信息自动采集、高效共享和实时监控的重要任务,是.智能用电服务体系的重要基础和用户用电信息的重要来源。系统经过近三前言 年建设,已投入大规模应用,城区用户已实现全覆盖,开始向乡镇延伸,抄表率等指标也纳入同业对标考核体系。随着系统的大规模建设,系统的运维服务工作将是建设后期的重点。

二、

当前建设的采集系统主要是将智能电能表、集中抄表终端作为系统的底层基础设施,以低压电力载波、微功率无线、RS-X185 , }PRSICDA}}A、光纤专网等为主要通信载体,结合先进的控制手段和软件技术,对电力用户的用电信息进行采集、处理和实时监控的系统。初步统计截止目前国家电网28个直属省公司均已建成用电信息采集系统,己安装智能电能表约1. 1亿只,在运行集中抄表终端(指集中器和专变终端)约百万只。如此庞大的系统,如何保障它可靠、稳定的运行,将是后期工作重点。在当前的运维工作中主要存在如下问题:

1、 缺乏专业化的维护队伍

采集系统由于其资源技术的特有和保密性,在现阶段调试和售后维护基本依靠各供应商来完成,运维工作内外部的定位和分工不是很明确,虽有供应商承担一部分工作,但因为成本和责任的问题易出现内外部维护人员积极性不高、相互推谱、相互依靠的问题。导致服务质量不高,内部人员技术掌握不深入、不全面,而且从人员结构上来说,无相应的岗位设置或相应岗位缺乏专业人员,缺乏一支具备系统和专业知识的运维队伍。

2、 运维工作缺乏系统性

采集系统属于集成系统,整个系统涉及的供应商多且分散,在进行运维服务时各自为政,形成马路警察各管一段的现象,缺乏系统全面的运维思路。如:服务器是生产商,外网是通信运营商,智能电能表是电表供应商,终端设备是终端供应商,本地通信介质是相应的载波微功率芯片供应商。出现问题只是一味的头痛医头,脚痛医脚,不能从整个系统的角度出发审视和解决问题。

3、 系统运维缺乏持续性和连贯性

系统运维现状及问题 随着国家电网公司统一招标模式的开展,竞争淘汰机制加剧,部分供应商难以适应此种竞争形势,被淘汰出局。更多供应商则面临地域分散、售后服务成本增大等诸多问题,而且很多地区与供应商签订的合同承诺售后服务期限已到,各供应商为降低成本导致售后服务出现断档和衔接不上的情况。

4、 系统运维缺乏前瞻性

当前在采集系统运维中的思路是发生问题及时解决、处理,以提高抄表率等指标为工作目标。但对于系统运维工作来说不光需要的是能迅速地定位、解决问题,更重要的是在故障发生前能够发现隐患并消除隐患,使系统长期稳定地运行。这就要求我们在系统运维过程中,需要有一定的前瞻性,防患于未然。如果运维人员能在故障发生之前,在例行巡检之中,及时检测到故障的先兆,将故障解决在萌芽期,这样不但可以避免故障发生后,由于抢修的慌乱、业务中断所造成的经济损失。而且还可以避免故障严重化对整个系统所造成的损伤,从而延长系统的使用寿命。而这一切不但要求维护人员有深厚的功底,丰富的维护经验,还要有洞察秋毫的高度敏感性。

三、

运行维护顾名思义由运行及维护两部分内容组成。运行维护不仅仅是保证系统正常运行,问题出现时能迅速定位、解决问题。而更重要的是在故障产生前,能够通过例行的巡检工作及时发现故障隐患、消除故障隐患,使设备长期稳定地运行。对设备良好、有效的维护,不仅能够减少系统的故障率,并且可以延长设备的使用寿命。基本原则就是在例行运行维护工作中及时发现、解决问题,防患于未然。目前常见的两种运维模式分别是外维和内维。

1、 内维模式

指通过内部人员来承担整个系统的运行维护工作。用电信息采集技术是集电能测量技术、计算机技术和网络通信技术于一体的一门综合技术。要求维护人员在有电能计量知识和安装技能之上,还要学习采集系统工作原理,掌握终端应用功能、设置、安装和故障处理技能,根据岗位要求学习计算机原理、网络通信、采集通信和电表通信规约、了解继电保护等相关专运维解决方案及建议 业知识。不仅人员和岗位需求量大,而且专业化程度要求较高,所以此种模式在当前国家电网公司的发展状况下,存在很多弊端。

2、 外维模式

指将系统运维外包给专业的服务公司,把过程交给专家,自己控制结果,外维服务正成为现代企业发展的趋势。这样不但可以降低系统运营成本,而且系统运营效率也大为提高。智能电能表、终端和系统主站等并不能够保证为企业效益做出贡献,我们需要的是采集系统对企业业务的支持,需要的是运用采集系统的结果。运维服务外维作为专业服务的一种,具有以下几点基本特点:

(1) 基于企业战略发展的选择

尽管服务外维的出现是源于降低企业在系统运营维护方面的日常开支,缩减管理成本,但是现在企业选择外维服务更多的是出于培育企业核心竞争力的考虑。企业将更多的精力和资源投入到自己擅长的核心业务中,而辅助性的业务、非核心的业务则交给外部的专业人士来承担,以获得更高的整体运营效率。服务外维正成为企业实施长期发展战略的重要选择。

(2)履行服务的系统性和延续性

服务外维可以是一种长期的委托行为,一般合同履行的时间比较长,三年、五年,或者十年、几十年。有些合同也比较短,在一年以内。许多外维服务合同规定一段时问的试用期,作为对外维服务商的考察和绩效指标体系设计的基础。

(3)以采集系统之上的业务流程为外维对象

传统外维服务涉及各个行业,而采集系统外维服务的外维对象则是针对采 集系统或者采集系统之上的业务流程。随着外维服务的发展,特别是业务流程 外维的发展,采集系统外维服务包含的内容也会更加广泛,介入内部管理的层 面更加深入,以第三方的角度审视业务流程。

综上所述,采集系统运维外维模式将会成为其实施长期发展战略的明智选 择,具有重要的意义。

三、运维组织分析

用电信息采集系统是集信息通信、计算机网络、海量数据处理、电力自动化技术及营销管理于一体的集成系统,涉及业务层知识面广、技术层知识面深,必须具备足够技术和业务水平的公司方能站在系统全面的角度进行运维工作,以其服务的专业性、前瞻性、持续性来推动系统的运维工作的良性进行。

1、组织简介

南瑞集团是国家电网公司直属产业单位,2012年经过产业重组整合得到进一步发展壮大,主要从事电力系统二次设备、信息通信、智能化中低压电气设备、自动化设备等的研发、设计、制造、展与外延式扩张相结合,产业实力雄厚,销售及工程服务。集团坚持内涵式发 下设31个产业公司,京、武汉、合肥等10多个地区,形成电网自动化及工业控制、分布在南京、北信息通信、继电保护及电力电子、智能化电气设备等优势明显、业务突出的产业群,具有300多个自主知识产权的高新技术产品,初步形成覆盖智能电网各环节的完整产品链。

2、组织结构

南瑞集团组织结构划分主要分职能部门、支撑机构、专业机构、产业群四大板块,其中产业群主要包括:营销与工程总包、电网自动化及工业控制、信息通信、继电保护及柔性输电、发电及水利环保、智能化电气设备、非晶合金变压器、电线电缆八大产业。信息通信板块涵盖了智能用电的整个产品链,从智能用电硬件设备的研发、制造、生产及用电信息采集系统软件的技术开发、实施,到整个系统的维护与售后服务都有着完备的技术力量支撑,完全具备承担采集系统整体运维工作的能力和资格。

四、运维服务内容及费用核算

从用电信息采集系统的运行性能、稳定可靠性、在线状态、业务管理三个方面实现对用电信息采集系统的运维管理,基本服务内容如下:

l、服务内容

服务内容的需求是多方面的,从服务能力来区分,可以分为基础服务(包括工程服务、维护服务)、专业服务、运营咨询服务等多个方面。

(1) 用户现场技术人员值守

可根据用户的需求提供长期的用户现场技术人员值守服务,保证系统的正常运转。现场值守的技术人员每天查看系统运行情况,进行整体系统性能评估,针对运行情况进行优化并提出合理化建议。 (2)现场巡检服务

现场巡检服务是我公司对客户的设备及网络进行全面检查的服务项目,通过该服务可使客户获得设备运行的第一手资料,最大可能地发现存在的隐患,保障系统稳定运行。同时,我公司将有针对性地提出预警及解决建议,使客户能够提早预防,最大限度降低运营风险。 (3)重要时刻专人值守服务

我公司深刻知道保证重要时刻设备稳定运行对客户成功尤为关键,因此,我公司可对客户提供重要时刻的专人现场值守支持,包括结算日或客户认为可能对其业务运营产生重大影响的时刻。

(4)系统运行分析与咨询管理服务

系统运行分析与咨询管理服务是指我公司工程师通过对系统运行状况、系统问题进行周期性检查、分析后,为客户提出指导性建议的一种综合性服务。 (5)技术培训

不定时对系统的使用进行现场培训,提高客户技术实力和专业水平。

2、服务流程

我公司采用的服务方式主要为两种:一种为技术人员现场值守,另一种是定期巡检结合故障现场服务。

技术人员现场值守运行维护服务的基本操作流程如下图所示:

定期巡检结合故障现场运行维护服务的基本操作流程如下图所示:

3、费用核算

按照目前采集系统系统部署、终端类型、运行模式及地点分布,运维费用预算按年度进行核算,大致核算方式如下:

上一篇
下一篇
返回顶部