it运维服务体系
第一篇:it运维服务体系
IT运维服务企业如何构建完善的运维服务体系
2012-12-28 16:30 王财 中国软件评测中心 我要评论(1) 字号:T | T
从事IT运维服务的相关企业如何构建完善的IT运维服务体系,并通过ITSS评估。本人结合2012年ITSS运维服务能力第一批和第二批评估经验,就IT运维服务企业如何构建完善的运维服务体系及如何保证ITSS评估,提出几点意见和建议。
随着IT运维服务行业的逐步成熟,IT运维服务行业已经形成了一套基本的服务框架和较完整的服务产业链条,而且IT运维服务已经成为了IT产业链条中的一个重要环节。国家标准化管理委员会于2012年11月5日正式下发《中华人民共和国国家标准公告(2012年第28号 )》,公布ITSS中的《信息技术服务 运行维护 第1部分:通用要求》(简称:通用要求)、《信息技术服务 运行维护 第2部分:交付规范》以及《信息技术服务 运行维护 第3部分:应急响应规范》 3项国家标准颁布实施,国家标准号分别为:GB/T 28827.1、GB/T 28827.
2、GB/T 28827.3,实施日期为:2013年2月1日。
从事IT运维服务的相关企业如何构建完善的IT运维服务体系,并通过ITSS评估。本人结合2012年ITSS运维服务能力第一批和第二批评估经验,就IT运维服务企业如何构建完善的运维服务体系及如何保证ITSS评估,提出几点意见和建议。
(一)建立符合通用要求及企业自身特点的IT运维服务目录
企业的运维服务目录大类要与IT运维服务目录 标准一致,其中一级服务目录包括基础环境运维服务;硬件运维服务;软件运维服务;安全运维服务;运维管理服务及其它运维等六大类,二级包括如网络运维服务;主机运维服务;应用软件服务等十三小类。要求IT运维服务企业为甲方提供的运维服务目录要细化到二级,且要根据实际的提供的运维服务内容进一步细化。在IT运维服务目录中要详细介绍每种服务的具体服务内容、服务方式、运维过程中的交付成果、成
果交付的频度等参数。甲方一般只需要参照IT运维服务企业提供的服务目录选择需要的运维服务项目即可,并按照选择IT运维服务项支付相应的服务费用。运维服务企业在与甲方签订的《IT运维服务协议》中要明确具体的IT运维服务项及每种服务的具体服务内容、服务方式、运维服务过程中的交付成果、成果交付的频度,服务人员能力要求,运维服务水平评价标准,备品备件的提供等方面,并有可量化,可评价等属性。
(二)依照企业的IT运维服务目录和运维服务需要制定相应的管理制度 为给甲方提供规范、安全、可靠的运维服务,IT运维服务企业需制定一套科学、完整、详细、且与IT运维服务目录相匹配的运维服务管理制度。包括完善的管理组织结构,明确的岗位职责、人员素质能力要求、工作流程和管理制度等方面。如人员管理规范,资源管理和储备规范,事件响应规范,问题管理规范,监督管理规范,质量管理规范,信息安全管理规范,知识库(财富库)管理规范,服务台管理规范等。另外还包括在实施运维服务项目过程中所需的各类模板。如运维服务计划,监督管理计划,培训计划,服务报告,季度报告,事件报告单,问题处理单,满意度调查单等。
在实践中,IT运维服务企业以管理制度为保证、以运维服务计划为依据为甲方提供良好的运维服务保障。IT运维服务企业若要参加IT运维能力(ITSS)评估还需要参照《ITSS通用能力评估申请表》中要求提交的18个文件。
(三)规范运维服务合同
构建完善的运维服务体系还需从IT运维服务合同着手。IT运维服务企业要规范要求与甲方签订的运维服务合同,合同中不仅要规定服务的内容,合同价格,还应该依据运维服务目录和客户的运维服务要求,起草包括详细服务条款的《运维服务合同》附件。一般包括服务内容(服务项),服务方式,每项服务的服务质量要求的关键量化指标,服务质量报告的提交方式,提交的频度,服务评价基准等方面。合同是运维服务方为甲方提供合格运维服务的依据,所以运维服务企业要在甲方允许的范围内,尽量细化服务指标,至少应细化到服务目录中所展示的级别。
(四)明确组织内成员的岗位职责
依据运维服务目录和运维服务项目要求制定完善的岗位职责制度,包括管理岗位和运维服务岗位两类。一般包括明确的岗位职责说明,清晰的岗位考核指标体系和对应的监督和考核机制。
(五)有监督服务机制
为保证运维服务企业给甲方提供优质的运维服务,运维服务企业需要建立两级监督服务体系。第一级是项目级监督。项目经理对项目成员的工作进行监督,项目成员之间也可相互监督,保证运维服务工作顺利开展,出现问题时能按照问题的应急预案及时解决。第二级是组织级监督。组织级主要是公司高层主管领导和有关的管理部门,公司高层主管领导及有关的管理部门应该对运维服务项目的状态进行监督和控制。保证运维服务项目按照计划执行,同时在项目层和组织层的监督范围内。组织级的监控主要集中在服务台,服务台的工作主要包括日常的事件受理、派单、回访等,还包括满意度调查等。
(六)有服务台
服务台是运维服务的中央处理器,用以接收客户的事件报告并及时予以处理、回访,接收客户投诉等。IT运维服务企业要建立服务台,并有服务台管理机制。服务台接到的事件报告后,常规事件通过服务台直接解决,非常规事件或无法通过服务台解决的事件,服务台要按照相关制度派发工单,安排运维工程师到现场解决。 服务台还应定期或不定期对客户就运维服务的满意度进行调查,并对调查数据进行分析统计,并通报有关部门和成员。
(七)建立PDCA机制
运维服务管理体系中包括策划、实施、监督、改进等环节。PDCA机制应覆盖到运维服务的各环节,各方面。如运维服务管理制度、服务流程、服务质量、服务能力、资源、技术等。
IT运维服务企业构建完善的IT运维服务体系,要从制度、流程、人员、技术、资源等方面入手,力争做到制度全面,流程规范、清晰,人员职责明确,技术成熟,资源能满足运维需要。若从ITSS评估的角度来看,目前大多数运维服务企业主要问题突出表现在流程不够规范,制度落实不到位,实际中以人治为主,法治为辅;人员岗位职责不详细;备品备件类资源储备不达标;缺乏有效的监督
机制;缺少完整的实施记录;缺少改进机制;缺少内审等。建议企业从基础抓起,做好内部审核,构建完善的运维服务体系。
第二篇:IT运维服务合同()[范文]
IT运维服务合同
甲方: 乙方: 鉴于:
甲方需要乙方为网络、硬件等信息化建设中所需的内容提供技术支持与维护服务,乙方愿意以本合同约定的条款和条件向甲方提供技术支持与维护服务,以满足甲方信息化网络正常运行的需要。甲、乙双方经平等协商一致,签订本合同。
第一条:基本原则
1.1本合同旨在明确乙方向甲方提供信息化建设中所需的技术支持与维护服务时,甲、乙双方必须遵守的基本原则,以及技术支持与维护服务的基本内容等事项。
1.2乙方所提供的技术支持与维护服务,符合国家相关部门有关技术质量的规定标准和甲方需求。甲方有权对乙方技术人员的工作态度、完成情况进行监督、签收,提出意见,以提高维护服务质量。
1.3乙方服务人员应严格遵守公司的各项规章制度,否则,甲方有权根据实际情况对乙方做出相应处罚。
1.4由于不可抗力或甲方及其他第三方的原因而给甲方设备造成的损失,乙方不承担责任。
1.5甲方委托第三方对设置在其网内的设备及软件进行调整、变更时,应及时通知乙方,以便乙方及时掌握网内设置及软件增减或变更情况,更好地为甲方提供服务。 1.6甲方需要从网内迁移其设备时,应提前通知乙方,以便于双方配合,甲、乙双方可就设备迁移具体事项另行协商。
1.7乙方有权在合同期内参加信息化建设系统建设中的随工、测试、验收等工作。
1.8甲、乙双方履行本合同的技术支持与维护服务时,双方之间应提供必要的便利条件,积极配合。
1.9指定联系人:甲方指定 为联系人,乙方指定 为联系人,全权负责日常服务合作事宜,双方指定联系人发生变化时,应在3个工作日内书面通知对方。
第二条:技术支持与维护服务的范围和约定 2.1 技术支持与维护服务的场所:
(场所填写)
2.2技术支持与维护服务的内容:乙方应根据的要求,提供相应的技术支持与服务,并应达到关于服务质量的要求,乙方应对其人员提供服务所引起的对用户的损害承担赔偿责任。具体的服务方式及范围如下:
(1) 网络技术支持与维护:„„
(2) 核心设备技术支持与维护:网络系统核心设备包括等,以上设备的技术支持、日常维护、故障处理、定期保养清洁、定时备份,保证设备的正常运行。
(3) 接入设备技术支持与维护:„„
(4) 终端设备:„„。以上设备的技术支持、日常维护、故障处理、病毒防治,保证设备的正常运行。 (5) 应急处理:双方协商确定多种应急处理方案,必要时进行应急预案演习,保证在出现意外情况时能够尽量减少或避免因为系统的故障而产生的不良影响(比如服务器故障、停电、通信线路故障、网络遭受病毒攻击等)。 2.3技术支持与维护服务方式
(1) 合同签订后,乙方派 名专职技术人员,进行网络系统的技术支持与维护。另派 名技术人员随时响应进行技术支持与维护。
(2) 快速上门:若甲方的设备、系统、网络在使用中发生故障,乙方应以电话和远程等方式支持提供解决方案,如无法解决,则在规定时间( X小时)内上门维修。 (3) 硬件维修:„„
(4) 技术咨询:乙方有义务根据要求提供电话热线服务、进行各种电脑操作指导,提出关于设备更新、软硬件升级等合理化建议。乙方具备提供后续技术支持与维修服务的能力。 2.4技术支持与服务标准
(1) 保证网络设备及系统运行正常。 (2) 服务时间:X小时/天*X天/周。
(3) 建立技术支持与维护服务登记制度:乙方对每一次电话咨询、故障申告等进行登记,并将处理过程和结果进行记录。对上门维护服务登记时,要有乙方的签字认可。
第三条:技术支持与维修服务费及支付方式
3.1根据甲方网络所用设备总价、服务场所的分布情况、技术支持与维修服务的人员配备,通过谈判:本合同技术支持与维护服务费总额为人民币: 元整。
3.2甲乙双方在本合同签订后,甲方向乙方支付本合同款。(支付方式) 3.3技术支持与维修服务中的低值易耗物品、所需工具、笔记本电脑、通讯工具、仪表、车辆、交通费等由甲方负责;
第四条:权利义务的转让
4.1任何一方未经过对方的书面同意,不得转让本合同项下的任何一项权利和义务。
4.2 甲方和乙方应将谈判文件、商务文件、技术文件作为合同基础。 第五条:保密
5.1 乙方有责任对甲方提供的相应文档、技术资料、安装介质进行妥善保管,并保证遵守相应的保密协议,避免用户机密的泄露,如有因乙方技术人员失误或故意行为导致的用户机密泄露,乙方要承担相应的赔偿责任。
5.2除了按照甲方要求完成指派的服务工作,乙方无权代表或以甲方的名义从事任何商业活动,本协议不在双方之间产生任何代理、合资、从属关系,任何一方在未得到对方的实际书面许可之前,不得使用对方的名称、商标、商号、标识等任何知识产权。
第六条:违约责任
6.1 任何一方未履行本合同项下的任何一项条款均被视为违约。任何一方在收到对方的具体说明违约情况的书面通知后,如确认违约行为实际存在,则应在20日内对违约行为予以纠正并书面通知对方;如认为违约行为不存在,则应在20日内向对方提出书面异议或说明。在此情形下,甲、乙双方可就此问题进行协商,协商不成的,按本合同争议条款解决,违约方应承担因自己的违约行为造成的直接经济损失。
6.2 甲方有权定期或不定期检查维护质量,对乙方未达要求的,核减相应的维护费用。
第七条:免责条款
7.1 因不可抗力导致甲乙双方或一方不能履行本合同项下有关义务时,甲、乙双方相互不承担违约责任。但遇有不可抗力的一方或双方应于不可抗力发生后10日内将情况告知对方,并提供相关证明。在不可抗力影响消除后的合理时间内,一方或双方应当继续履行合同。
第八条:技术支持与维护服务期限
8.1 自 年 月 日起,至 年 月 日止。本合同自签订之日起生效。
第九条:通知
9.1 依照本合同要求任何一方发出的通知或其它联系应以中文书写,通知可以专人递交,或以挂号信件、或以公认的快递服务或图文传真发送到另一方。通知视为有效送达的日期应按下述方法确定:
(1)专人递交的通知在专人递交之日视为送达;
(2)以挂号信件发出的通知应在寄出日(以邮戳为凭)后第十日视为已送达;
(3)以图文传真发送的通知在成功传送和接受日后的第一个工作日视为已送达。
第十条:争议的解决
10.1 对于本合同履行而发生的争议,双方协商解决或提交当地人民法院裁决。
第十一条:附则
11.1 未经双方书面确认,任何一方不得变更或修改本合同。
12.2对于本合同未尽事宜,双方可随时签订补充协议或以附件的形式对本合同中的有关问题作出补充、说明、解释。本合同的补充协议和附件为其不可分的部分,与本合同具有同等法律效力。
12.3 本合同须加盖“骑缝章”,以确保合同的完整。
12.4 本合同共 页一式两份,双方各执一份,甲、乙双方法定代表人或授权代表签字并加盖公章后,方可生效,均具有同等法律效力。
甲方代表签字: 乙方代表签字:
盖章: 盖章:
日期: 日期:
第三篇:IT运维服务工作规范
为了规范化管理我公司对用户提供的系统维护服务,特制定以下维护服务工作规范:
一、 维护服务内容与范围
“维护服务”是由本公司承担的为合同用户提供的定期维护服务。服务内容与范围仅限于本公司与用户签订的维护服务商务合同规定的维护服务内容与范围之内。
二、 任务接受与任务交接 1. 任务接受
“任务接受”是指由公司指派专人承担(指派任务前,公司会提前征求本人意见)某项维护服务工作。凡承担该项维护服务的人员,必须严格执行本规范。 2. 任务交接
“任务交接”是指接受某项维护服务任务的责任人因某种原因临时或长期不能承担此项任务,则该责任人应当提前30日向公司提出“任务交接申请报告”(见附件四),在公司与用户协商并批准该项文件后,该项任务责任人将与公司指定的接任人完成任务交接工作。“任务交接”工作规程为:
1) 提交“任务交接申请报告”(必须提前30日); 2) 接到批准通知后,向接任人及用户交接工作;
3) 在交接工作完成后,提交由公司主管、用户以及接任人三方签字确认的“任务交接报告”(见附件五); 4) “任务交接报告”的内容包括:
维护服务任务可以由接任人承担的确认;
对接任人进行涉及该项维护任务的专项技术培训的内容与结果的确认; 本规范规定的全部维护服务技术文档;
接任人、公司、用户项目负责人及用户项目部门主管的签字。
三、 维护服务工作规程
1. 在执行维护服务工作前,必须熟悉该项维护服务合同中规定的
维护服务内容与范围的条款;
2. 根据维护服务合同中关于维护服务的条款制定维护服务计划,并以书面文件形式提交公司与用户确认,待双方确认后执行; 3. 在执行维护服务计划的过程中,必须建立完整的技术文档。
四、 维护服务技术文档 1. 维护服务技术文档包括: 1) 维护服务授权表(见附件一);
2) 维护服务过程报告(编制内容及说明见附件二); 3) 维护服务计划; 4) 月度维护服务总结报告;
5) 季度/维护工作任务完成记录汇总表(内容见附件三); 6) 维护工作验收报告。 2. 关于维护服务技术文档的说明
1) “维护服务过程报告”的内容必须包括:
维护过程的纪录文件,包括文字描述、检查过程记录、相关图表(程序、表单等的屏幕拷贝)、会议纪要、技术分析与结论; 故障处理的技术解决方案。
2) “维护服务计划”必须以公司与用户正式签订的维护服务合同规定的服务内容与条款为依据,以表格形式编制维护计划,内容包括: 维护服务内容以及专业技术培训内容; 维护服务的时间安排;
计划投入的资源(包括公司在该项目上的协作方); 计划编制人以及计划审批人(公司与用户); 计划附件:
维护服务合同规定的服务内容与条款; 计划变更说明。
3) “月度维护服务总结报告”内容:
月度维护服务工作的总结,主要包括技术总结以及双方维护管理工作改善的建议; 计划执行情况的评价。
4) “季度维护工作任务完成记录汇总表”。该表主要用于提出此项要求的用户。如果用户没有在合同中专门指定此项要求,则我公司项目责任人应在“维护工作验收报告”中包含“维护工作任务完成记录汇总表”。
5) “维护工作验收报告”是对于当年维护服务工作的总结报告,该报告必须包括项目维护服务管理总结和技术总结两部分内容,“季度维护工作任务完成记录汇总表”和“维护工作任务完成记录汇总表”必须作为该文件的附件。 3. 维护服务技术文档提交时间
1) 维护服务授权表提交时间为:每次用户现场维护服务工作完成时; 2) 维护服务过程报告提交时间为:同上;
3) 月度维护服务总结报告提交时间为:当月结束后的第一周; 4) 季度维护工作任务完成记录汇总表提交时间为:下一季度的第一周;
5) 维护工作验收报告提交时间为:合同期结束前30日或合同规定的项目验收期前30日。
五、 其它 1. 本规范自下发之日起生效; 2. 公司拥有本规范的解释权;
3. 公司将根据本规范执行情况以及用户的要求,对规范进行不定期补充或修改。
六、 附件
1. 维护服务授权表 2. 维护服务过程报告
3. 月度/季度/维护工作任务完成记录汇总表 4. 任务交接申请/交接报告
XXX有限公司2xxx年x月
第四篇:IT运维服务工作规范
为了规范化管理我公司对用户提供的系统维护服务,特制定以下维护服务工作规范:
一、 维护服务内容与范围
“维护服务”是由本公司承担的为合同用户提供的定期维护服务。服务内容与范围仅限于本公司与用户签订的维护服务商务合同规定的维护服务内容与范围之内。
二、 任务接受与任务交接
1. 任务接受
“任务接受”是指由公司指派专人承担(指派任务前,公司会提前征求本人意见)某项维护服务工作。凡承担该项维护服务的人员,必须严格执行本规范。
2. 任务交接
“任务交接”是指接受某项维护服务任务的责任人因某种原因临时或长期不能承担此项任务,则该责任人应当提前30日向公司提出“任务交接申请报告”(见附件四),在公司与用户协商并批准该项文件后,该项任务责任人将与公司指定的接任人完成任务交接工作。“任务交接”工作规程为:
1) 提交“任务交接申请报告”(必须提前30日);
2) 接到批准通知后,向接任人及用户交接工作;
3) 在交接工作完成后,提交由公司主管、用户以及接任人三方
签字确认的“任务交接报告”(见附件五);
4) “任务交接报告”的内容包括:
维护服务任务可以由接任人承担的确认; 对接任人进行涉及该项维护任务的专项技术培训的内
容与结果的确认;
本规范规定的全部维护服务技术文档; 接任人、公司、用户项目负责人及用户项目部门主管的
签字。
三、 维护服务工作规程
1. 在执行维护服务工作前,必须熟悉该项维护服务合同中规定的
维护服务内容与范围的条款;
2. 根据维护服务合同中关于维护服务的条款制定维护服务计划,并
以书面文件形式提交公司与用户确认,待双方确认后执行;
3. 在执行维护服务计划的过程中,必须建立完整的技术文档。
四、 维护服务技术文档
1. 维护服务技术文档包括:
1) 维护服务授权表(见附件一);
2) 维护服务过程报告(编制内容及说明见附件二);
3) 维护服务计划;
4) 月度维护服务总结报告;
5) 季度/维护工作任务完成记录汇总表(内容见附件三);
6) 维护工作验收报告。
2. 关于维护服务技术文档的说明
1) “维护服务过程报告”的内容必须包括:
维护过程的纪录文件,包括文字描述、检查过程记录、相关
图表(程序、表单等的屏幕拷贝)、会议纪要、技术分析与结论;
故障处理的技术解决方案。
2) “维护服务计划”必须以公司与用户正式签订的维护服
务合同规定的服务内容与条款为依据,以表格形式编制维护计划,内容包括:
维护服务内容以及专业技术培训内容;
维护服务的时间安排; 计划投入的资源(包括公司在该项目上的协作方); 计划编制人以及计划审批人(公司与用户); 计划附件:
维护服务合同规定的服务内容与条款;
计划变更说明。
3) “月度维护服务总结报告”内容:
月度维护服务工作的总结,主要包括技术总结以及双方维护
管理工作改善的建议;
计划执行情况的评价。
4) “季度维护工作任务完成记录汇总表”。该表主要用于提出此项
要求的用户。如果用户没有在合同中专门指定此项要求,则我公司项目责任人应在“维护工作验收报告”中包含“维护工作任务完成记录汇总表”。
5) “维护工作验收报告”是对于当年维护服务工作的总结报
告,该报告必须包括项目维护服务管理总结和技术总结两部分内容,“季度维护工作任务完成记录汇总表”和“维护工作任务完成记录汇总表”必须作为该文件的附件。
3. 维护服务技术文档提交时间
1) 维护服务授权表提交时间为:每次用户现场维护服务工作完成
时;
2) 维护服务过程报告提交时间为:同上;
3) 月度维护服务总结报告提交时间为:当月结束后的第一周;
4) 季度维护工作任务完成记录汇总表提交时间为:下一季度的第一
周;
5) 维护工作验收报告提交时间为:合同期结束前30日或合同
规定的项目验收期前30日。
五、 其它
1. 本规范自下发之日起生效;
2. 公司拥有本规范的解释权;
3. 公司将根据本规范执行情况以及用户的要求,对规范进行不定期
补充或修改。
六、 附件
1. 维护服务授权表
2. 维护服务过程报告
3. 月度/季度/维护工作任务完成记录汇总表
4. 任务交接申请/交接报告
XXX有限公司
2xxx年x月
第五篇:IT运维服务外包参考资料[模版]
选择IT运维服务外包优势
现如今,企业为了更好的节省开支,维持业务运营,纷纷选择IT运维服务外包作为运维手段。IT运维到底应不应该外包?如何选择外包合作伙伴?又该如何管理外包、并与外包公司长久相处?这三大问题长久以来一直困扰国内中小企业用户,让他们在 IT运维外包之路上徘徊不前。
在竞争日益激烈的今天,企业发展将越来越取决于核心业务的成败,将非核心业务外包给最擅长的专业公司去做,已经成为全球企业重要的战略思想和经营模式。
国外知名资讯机构的调查表明,全球90%的公司中至少有一项主要IT业务职能已选择IT运维服务外包,IT运维外包服务在国外很多国家得到了充分肯定和广泛的应用。2005年,全球运维外包服务市场整体规模已达到726.37亿美元,市场增长率为9.5%。外资企业用户市场需求的不断发展和本土用户行业需求的不断深入,催生了中国运维外包服务市场的进一步发展。据统计,中国运维外包服务市场规模2005年达到38.69亿元,同比增长了20.2%。近两年来,中国IT运维外包服务市场仍将保持快速发展趋势。
在这一大趋势下,众多借助外包,甩掉各种包袱与非核心业务的现代“轻公司”脱颖而出。这些公司机构简单,规模不大,运行灵活,但可调动和控制的资源丰富,并能创造高额利润,非常适应现在竞争中要求灵活多变、创新进取的潮流,其秘密武器就是引入了多种灵活的IT外包。
IT与外包,本是一对孪生兄弟。软件工程、项目开发、基础网络、呼叫中心等IT外包业务由来已久,在国内外都应用广泛。但是对于“IT运维外包”,跨国公司和国内中小型企业的态度却大相径庭。
国内众多中小企业CIO对于选择IT运维服务外包大多心存好感,但又有多重顾虑。首先是饭碗之忧,选择外包,IT部门和CIO会不会面临无事可做进而失业的危险?其次是质量之忧,万一效果不好,会不会造成花钱费力办坏事的结局?还有成本、管理、绩效等大大小小的问题,以及难以量化描述的“客户满意度”,让很多国内用户对于IT运维外包有心无胆,最终选择在IT项目上线后自行维护的方式。
与国内企业相比,欧美跨国公司CIO却不约而同都引入了IT运维外包。客齐集市场总监李佳的话很有代表性:“选不选择外包,不是CIO的个人喜好问题,而是企业要在有限的资源条件下实现利润最大化的必然选择。为了控制人力成本、保证IT的质量、时间和应用效果,选择外包是必然的。因为外包服务商的成本优势和专业优势是显而易见的。”
特灵空调IT总监汤国忠认为国内企业对于IT运维外包会影响“饭碗”的想法太过保守,而这种保守的想法倒可能真正会让CIO失去饭碗。他认为:“在系统上线后,CIO带领IT部门陷入琐碎的日常运维工作中,其重要性也就会越来越低,产生出会被‘替代掉’的危机感。假设,CIO选择IT运维服务外包,借助专业服务,一方面可以提高内部用户对于IT支持的满意度,另一方面能让自己有时间、有精力去做更有价值、更重要的事情,才会使IT部门在企业中的地位越来越重要!”
如何做好IT项目的运维管理?
所谓 IT项目运维管理,是指单位 IT 部门采用相关的方法、手段、技术、制度、流程和文档 等,对IT 运行环境(如硬软件环境、网络环境等)、IT 业务系统和 IT 运维人员进行的综合管理。普通企事业单位的IT运维管理,存在着重操作、轻理论,重结果、轻总结的实际情况。根据相关统计,在日常的IT运维中。大约70%以上的故障是由业务人员首先发现的,而IT运维人员更多是担任救火队员的角色,表明了运维工作存在着大量的监测盲点,IT运维的工作处于相对被动的状态。这种传统的“见招拆招”式的IT运维管理方式已经不能满足企事业单位内部日趋扩大的信息化应用,而且在一定程度上也制约和影响了业务的开展。
IT管理和运维工作涵盖了各行业的各岗位中,如何提高工作效率,规避风险,更好的做好IT管理和运维工作,已经成为一个不断探索和研究的新兴课题。笔者认为,应从两个层面加强和完善IT管理和运维工作,可以改善IT运维工作的现状。
一、内部层面
1、转变IT运维管理工作方式和理念。强调从技术型向管理型转变。各企事业单位的应用系统和网络系统已经成支撑业务正常运转的重要基础,保证应用系统和网络系统的正常运行和使用成为了IT运维工作的重中之重。IT运维部门的职能应当从传统的重服务轻管理,逐步转变为服务与管理并行,规范化与人性化相辅相成的模式,以适应现代化信息的工作模式。
2、建立完善的内部信息共享平台。从基础设施。应用系统和业务服务三个方面打造完善的信息共享和资源监控平台。能建立有效的信息资源库,减低对关键技术人员的依赖,为日常IT运维和管理工作提供有效的保障:基础设施管理方面,对网络,应用系统软、硬件等资源进行细化管理,详细记录电子设备的出入库、维保、报废等环节。保证资源的有效利用;应用系统管理方面,对于各类应用系统的备份,日常维护进行有效管理控制,保证所有应用系统数据的一致性、准确性、及时性、可用性和完整性,并根据实际需要不断进行改进、完善或更新;业务服务管理方面,尽可能的记录所有的事件要素,包括问题描述、解决方案、操作人员等等。使得部门对人员的考核有了量化的标准,同时这个过程也有助于知识积累,形成有效的知识库,可以极大地减少对关键人员的依赖,降低人员流失的风险。
3、清理、简化现有IT运维管理制度。形成适合企事业单位管理实际的制度体系。以建立完整、规范、有效的内部规章制度体系为目标,紧密联系工作实际,按照适用、可行、合法、有效的原则,对现有规章制度进行全面的自查和清理。按照IT运维管理工作的职能分工分层次、分步骤地对制订的各项内部管理制度规程进行分类清理,从制度内容的适用性、可行性、依据和效力的合法性、执行的有效性等方面进行了逐条审核,并结合实际工作,对上级部门制订的内部管理制度与当前实际工作不符的情况进行修订和完善。逐步摈弃传统的“人管人”的工作模式,形成以制度带动人,以制度带动工作的长效机制。
4、建立例行巡查和通报制度。IT运维部门的负责人和业务主管可通过内部信息共享这一平台,对业务进行有效的监督。一是定期对记录的相关事项进行巡查,审计已登记发生事项的规范性。二是对正在发生的事件实时跟踪,及时了解事件的进展状况。规范各个流程的操作,从源头避免业务差错的发生。三是建立采集问题,核实整改问题及问题通报三个环节的通报机制,以提升力IT运维管理的效率。
二 、外部层面
1、加强与内部审计部门的业务合作。内部控制审计对组织治理、风险管理、改善控制效率和效果等方面有很大的促进作用。IT运维部门可配合内部审计部门进行运维管理,将内部控制审计作为常态化审计类型,通过这种方式,突出内控特点,运用规范的审计方法和评价体系,注重从控制、风险、管理等宏观层面查找问题、提出建议,以达到促进IT运维管理工作,完善内控和加强管理的目的。
2、通过内部审计部门,加强督导、整改等工作的实效。在IT运维管理工作的过程中,不仅要发现问题解决问题,更重要的是要形成完善的IT运维管理工作规范和流程,在这点上。可以通过内部审计部门对企事业单位内部进一步规范制度、程序和方法,形成对风险进行事前防范、事中控制、事后监督和纠正的动态过程和机制,强化重要业务环节的风险控制。加大检查力度,切实有效地推进督导、整改工作,建立内控管理的长效机制。
3、加强与内部审计部门的沟通交流和人员培训,培养复合型管理人员。定期组织IT运维人员和内部审计人员进行学习交流,探讨内控管理中存在的问题,交流内控管理的心得体会,充分发挥IT运维的技术优势和内控的管理优势,通过良好的内部沟通机制和完善的信息共享平台,建立内部控制体系运行网络和内部控制管理组织体系
专业IT运维助力企业IT实现价值
随着业务的不断扩展及IT的深化融合,IT运维在企业日常管理中的地位已经显得越发重要。然而,日常的运维工作繁琐、辛苦,还得不到认可。“吃力不讨好!”也成为很多兢兢业业的IT管理人员普遍存在的苦恼。
据统计,IT运维服务占到IT部门工作量的80%左右,其中包括人员、维护和故障修复的成本。而有关技术和基础产品的成本大约仅为20%左右,这一明显不平衡的比例,给不少企业IT部门带来巨大压力,束缚手脚,占用太多精力和时间。
转变观念 根本解放IT运维
IT运维,归根到底是一项服务性的工作,保证企业中的IT业务的稳步运行。但由于服务被认为产生的附加值偏低,被置于IT价值链的最末端,所以导致人们传统观念上的偏颇,从而企业导致对于服务的重视不足。而广大得不到话语权的CIO及IT管理人员只能被限制在日常的运维服务中,疲于奔命。
然而随着市场的发展,对于IT运维或IT服务的理解也在逐渐发生改变。如今仅仅是“卖产品”已经不能达到利益最大化的目的,越来越多的企业开始追求产品附加值,其中服务的价值也在慢慢开始受到重视。
而且随着信息化发展,企业日常业务也越来越离不开IT管理的支持,IT的及时性、稳定性和高效等特点,甚至影响到企业内外部的流程。由此可见,IT运维已经成为企业业务是否顺畅、高效的关键,所以企业解放IT运维已经是无法避免。
技术不断革新 IT运维不仅仅是工具
云计算、大数据等全新概念及技术不断涌现,让人们应接不暇的同时,人们是否会想到IT运维的创新呢?首先肯定是技术层面上的,在云的概念的引入,使得IT运维或服务的平台化成为可能,利用云及虚拟化技术,将服务放置在云端,从“工具”转换为“平台”,使得效率和成本都能得到大幅的提升。
同时,数据中心的飞速发展,也为企业提供了远程IT运维的可能,将数据、信息都放置在第三方数据中心中,由第三方专业服务团队托管,不仅降低企业自身的IT运维成本,也带来了更便利、快捷的服务。另一方面,数据中心在运维方面如何做到统
一、融合、高效的管理,也是提出了新的要求。
服务革新 创新实现企业IT新价值
虽然IT运维需要沉下去、把控细节,但广大CIO、IT管理人员仍然不能一味埋头做事,而是需要不断寻求新的方法。目前很多企业IT运维还存在不少误区或盲点,如重建设而轻运维,忽视流程细节的优化、缺乏整体规划等,都会对日常运维带来不少的问题。
近些年来,全覆盖式的咨询式第三方外包服务开始兴起。可以帮助企业从繁杂的事物性工作中解放出来,专心于业务及IT系统的建设。而且由于此类IT服务商专攻咨询及IT服务方面,相对更为专业,能够有的放矢的针对实际情况制定优化及改善的方案,提供最佳的改善策略。双方通过签订服务水平协议,可以有效的简化管理、并提升业绩。
从项目开始之初,IT服务商就根据企业的需求开展调研,从而有针对性的进行规划,预估未来的发展,事先就将问题杜绝。在实施期间,双方在密切保持沟通,不断优化、完善。在完成建设后,进一步建立全面的运维体系和机制,将运维的重要程度进行等级划分,形成差异化管理,保证稳定、安全。在长期的运维中的定期进行汇报及总结也是必不可少措施。
此外,IT运维也需要灵活定制,面向不同行业、不同规模的客户,提高灵活、可定制的服务,也是保证服务稳定实施的有力保证。
如今,由“成本中心”转化为“价值中心”已经成为企业发展的最终目标。然而面对如今这个产品微利的时代,服务所带来的高附加值,让追寻新突破的企业看到了发展的空间。但是,这一价值增长点也是不那么轻松,坚持以企业需求为导向,为企业创造长期的价值,才是IT运维的核心理念。
如何建立规范的IT运维管理制度
如何在有限的投入下尽快建立高效、规范的运维体系,提高IT管理水平,改善系统的运维质量,已经成为当前CIO面临的重要问题。尤其是如今很多企业把IT专项资金投入在着重解决从无到有的基础设施和系统的构建,然而却忽视了系统建设完成以后的运行维护;随之而来的是,信息化的运维压力和挑战逐渐凸现出来,已经成为影响信息系统应用效果的主要瓶颈。当系统进入运维期后,IT部门就像救火队一样,不知道什么时候、什么地方会出现“火”情。虽然作为CIO,一些具体的事情不需要CIO本人去做,比如系统参数的调整,订单的排程等,但是IT运维管理、系统运行维护、项目管理等工作他还是要一一过问。
IT运维被动救火,技术人员饱受抱怨
传统被动的、孤立的、分散的“救火队”式IT运维管理模式,让IT部门疲惫不堪。而且,随着公司业务模式的复杂化和多样化,更带来IT运营环境的复杂性和不确定性。在IT运维系统时,IT部门普遍面临多种问题。主要有以下几个方面: (1)运维人员被动救火,工作效率低下
在IT运维管理过程中, IT员工工作太被动,只有当事件已经发生并已造成业务影响时才能发现和着手处理。这种被动“救火”不但使IT服务人员终日忙碌,也使IT服务本身质量很难提高,导致IT和业务部门的满意度都不高等。
其中比较典型的例如IT部门响应服务需求时没有相应的时间记录工具,或者因为各种原因导致工作人员不愿使用工具记录工作情况,这样不仅不利于知识的积累和知识库的完善,更不利于处理过程的跟踪。
(2)流程规范不足,没有形成闭环跟踪
在运维流程方面,IT部门一直处于原始的状态。例如在事件处理流程上,存在以下几种典型的问题:①没有明确的事件升级标准,例如满足怎样的条件后,事件必须从一线转到二线支持工程师,再转到三线研发工程师处理。②没有事件的有限级定义标准,没有建立优先级和解决时限的关联关系,从而不能保证事件解决的实效性和 IT 资源的有效利用。③事件产生后没有明确而唯一的责任人,从而缺乏有效对事件监控和跟踪机制。④没有统一的 IT 服务管理对事件受理的界面,没有事件完整记录、没有及时反馈。
这些都使事件/服务请求处理过程中没有形成严格的闭环管理;没有建立明确的重大或紧急事件处理流程,从而不能保证在相应事件发生后有效及时地处理。对事件处理过程的记录比较分散,随意性很大,没有控制。更没有严格规范的流程政策和控制手段,使之存在太多的漏洞。整体运行维护情况无法一目了然,不能够清楚地知道各位员工的工作情况和工作状态,从而缺少对流程有效的监控和跟踪。 (3)缺乏运维技术工具
企业缺乏诸如事件监控和诊断工具等技术工具,事件不能在技术工具的支持下得到主动、快速处理。事件和工作任务在分派过程中没有相应的技术工具记录所有历史信息,不便于跟踪和分析;配置管理信息没有相关工具支持,以便为配置元素建立复杂的关系、状态等属性和提供相应查询功能。
总的来说,目前诸多企业在IT系统运维方面并没有高度重视,前期规划仅为解决短期IT建设问题。但随着企业规模的不断扩大,IT系统涉及的设备种类越来越多,对全系统的运营和维护管理提出了近乎苛刻的要求,而相对的则是IT运维的原始和落后的手段。
建立IT运维管理制度,关键在于规范 我们可以看出,在企业信息化发展到一定阶段,建设重点应该要从系统实施转向以应用运维提升为主,运维质量保障、安全机制变得重要起来,这时除了技术的保障以外,制度保障越显得重要。
作为CIO,应首先是一位管理专家,其次才是技术专家。由此,建立完善的IT运维管理制度是最主要的工作内容,是企业信息化有效执行和监督的立足点。IT部门本身管理不好,就不可能为业务部门提供满意的IT服务,业务部门对IT部门的满意度就会低,满意度低又会影响IT投资及新项目的开展,使IT部门陷入困境。所以建立高效规范的IT运维管理机制,是CIO走向战略管理的第一步。对于IT部门来说,可从以下几个方面来进行IT运维制度化。 (1)转变运维观念,树立规范化意识
树立只有建立制度化的IT运维意识,才能在日常繁杂琐碎的工作中有效的区分任务的优先级,将有限的资源投入到最能满足“客户”需要的工作中。
天下大事必作于细。那么,如何保证运维工作的“无微不至”呢?方法是把运维工作和制度化紧紧地捆绑到一起。没有规矩,不成方圆,运维工作很琐碎,关键在于规范而不是创新。只有各级运维技术人员一丝不苟、老老实实按规范做,才能够把事情做好。 (2)建立事件处理流程,强化规范执行力度
首先需要建立故障和事件处理流程,利用表格工具等记录故障及其处理情况,以建立运维日志,并定期回顾从中辨识和发现问题的线索和根源。建立每种事件的规范化处理指南,减少运维操作的随意性,在很大程度上降低故障发生的概率。
同时,建立IT运维管理制度非常重要,但是有了制度还要有人去执行,要强化执行制度比建立制度更重要的观念和意识。因此,对于IT部门来说,即使由于人力、财力非常有限,难以系统建设ITIL流程,但是制度化的ITIL运维思想的引入仍然是必要的。 (3)设立ITIL服务台,引入优先处理原则
设立服务台以确定服务要求和IT运维目标,ITIL指南要求企业定义服务台的关键流程,不仅仅定义流程是什么,还包括它们是如何运作的,还要指出每个流程对企业有什么影响和意义。当应用ITIL中的IT服务台及服务级别协议思想,例行的事就有人处理了;有了服务级别协议,制定事件处理优先级次序,就可把事件再细分为例行事件和例外事件。
(4)最后要引入SLA管理
SLA(Service Level Agreement即服务水平协议),IT部门应该自发给自己负责管理的系统或者客户服务建立一个能够量化的运维目标,这样不仅能够务实地提高服务质量和管理水平,也能够在目标达成后作为团队工作改进的成绩得到肯定,提高IT人员的工作成就感。
IT管理运维制度化难以逾越的两大难题 在信息化的建设中,制度建设是一道必要的保障。信息化不能一蹴而就,一化就灵,信息化不是万能的,还要靠制度去保障、去规范使用者的操作行为。换一句话说,只有用严格的制度去约束人的行为,才能杜绝随意性。
但从IT运维管理制度实际情况看,IT运维制度化在企业中并不受高度重视,面临着很多问题。IT运维管理制度的不完善,造成企业信息化发展不均衡和高失败率高,也是企业信息化不能深入开展的重要原因之一。目前企业在IT运维制度化存在难以逾越的两大难题: (1)运维制度不完整、缺乏规范
从总体上看,目前企业信息化管理制度内容,侧重硬件和网络方面的制度管理,而缺乏对软件、IT流程管理、IT资源的内容管理,IT运维管理制度不能科学全面的覆盖各项信息管理工作,从而容易造成信息管理上的漏洞。
(2)IT运维管理制度流于形式,缺乏必要的约束力
由于IT运维管理制度体系不健全,IT运维制度多数成为企业项目建设档案保存或作为应付对企业相关检查的材料,IT运维管理制度只是形式。另一方面,对于违反制度的行为和相关人员没有直接处罚和约束,也影响到IT运维制度工作的权威性,从而制约着IT运维工作的深入开展。
参照ITIL建立成功运维系统的三要素 从IT运维的现状和发展趋势来看,ITIL(信息技术基础设施库)已经成为推进IT运维体系建设和日常操作管理的首要标准和“最佳实践”参照。ITIL是起源于英国政府自身IT管理需求开发的标准。对照ITIL的九层评估模型,可以发现许多企业目前在人员、流程、技术等三个方面存在很多问题。也就是说,在进行IT运维管理时,要在这三个方面齐头并进才能从总体上提升IT运维服务管理。 (1)人员组织
在IT运维中人员因素应该是首要考虑的因素。因为ITIL的应用实际上是一个管理活动,特别依靠人的积极参与来完成。在管理过程中,可能涉及到人员的职能、利益、思维模式、工作方式等的转换,产生的误解、消极和阻力不容忽视。因此,除了在制度安排、企业文化方面的工作以外,更要积极采取多方面措施诱导和疏通,包括服务意识培训、ITIL运维技能培养、发展规划和激励等方式。 (2)管理流程
运维流程设计是ITIL实施核心之一,它必须结合现状,既不是现有管理流程的直接转述和电子化,也不是完全依照最佳实践的照搬拷贝。①流程是分阶段的目标定义、设计、固化、评价和改进过程。②ITIL作为IT部门内部管理的流程,存在和外部流程的接口整合衔接的问题,需要在运维流程设计和流程自动化处理等环节中妥善解决。另外,还应该充分了解:运维流程既有需要严格执行的僵化一面,也有面向效果灵活变通的一面。 (3)技术工具 管理工具是指在IT运维管理过程中能够借助的用来提高服务质量和效率的所有工具的总称。对于企业来说,要特别关注两类工具:①IT运维监控和诊断优化工具;②流程自动化工具。这里需要提醒的地方是,许多企业特别重视IT运维工具本身,而常常忽视了ITIL所倡导的通过流程等制度约束和引导,才能更好的发挥效益。因此,即使即使没有引入ITIL运维流程以及电子化平台,也应该利用建立一些必要的运维纸质流程和制度,否则难以得到很好的应用。
总之,想在IT系统运维过程获得最佳的效果,不是简单的单纯通过项目建设能够达到的,高效IT运维系统是需要一个持续改进、不断优化的长期过程,IT运维管理制度化也必不可少。
IT运维管理:“真”价值究竟在哪里?
在努力提升IT管理服务水平的同时,一个更深层次的讨论正在展开IT运维管理的真价值究竟在哪里?对于这一问题的回答,不仅关系到CIO和IT部门的话语权,更决定了现代信息化商业社会中,企业的发展与未来。
企业IT管理部门的宗旨是为组织的内部和外部提供优质高效的IT服务,而IT运维管理就是如何做到降价成本、提高效率,在满足企业IT服务需求的同时,提升IT运维水平,将IT部门由成本中心向价值中心转变这是很多IT管理者在描述IT运维工作目标时候的经典语录。但在表面的光环背后,IT运维管理部门在不少领导的心目中,却往往只是一个会花钱、说空话的部门。
虽然不断升级的云计算、应用交付、虚拟化等新技术浪潮,让IT运维管理需求成为炙手可热的话题。但相关的问题也随之而来,由于业务对IT系统依赖性不断增强,新的信息系统不断上线,IT人员不断增加,信息系统的运营费用也随之增加,在公司总运营成本中所占比重越来越大。在一些不太了解IT运维具体工作的领导眼中,如果每年的IT运维管理成本预算不断增加,而他又不清楚这些钱花到哪里去了,再加上时不时还会出现的IT故障和业务部门的投诉等等。这些问题积攒在一起, IT部门花钱惹麻烦的印象就顺理成章地形成了。
对于企业IT运维管理表面上被认可,但实际上体现不出真价值的普遍现象,锐捷网络IT运维管理业务部总经理冯晋阳认为:IT运维要显示出‘真’价值,不但要在底层设备完成监视与预警,还要在呈现上做文章。在当前经济形势下,任何一家企业都会注重成本管理,特别是其他费用大多都可精确衡量之后,IT运维成本价值模糊的问题就显得尤其突出。由于IT运维工作无法抛弃为业务部门服务的本质,也就决定了它缺乏张扬和展示手段,IT在企业中价值就有可能被冲淡。再加上业务系统时常遭受到IT系统的烦扰,无法提升管理效率,产生这样或者那样的投诉。所以,IT运维部门想要得到认可,就需要找到一个让别人发现自己价值的方法,这对于改变IT运维部门的尴尬局面将起到至关重要的作用。
传 统看、说、做 抹杀IT运维价值
面对这一问题,冯晋阳先生表示,实际上,传统的IT运维管理产品经过多年发展,虽然已经有了扎实的应用基础,但在体现IT系统真价值方面却还存在缺陷。
首先是看:假设企业的IT系统能够保持一个高效稳定的运行状况,不仅可以提升企业应对市场的能力,还可以降低企业的IT投入,最大限度地实现IT投资回报,这些都是IT运维管理的价值。那么,这个价值如何让领导层看到呢?是让领导亲临网管的桌子上,看看现在的网络流量有多么正常吗?想要知道答案,先拷问一下自己,如果你是一个管理上千人,几十个部门的决策者,你有时间去听网管给你解释每个参数的含义吗?答案是显而易见的。
其次是说:当企业领导询问IT运行情况时,我们只能回答好或者不好吗?当年终领导询问下一年的经费预算时,IT运维主管领导往往左顾右盼,只能说大概怎样。假设你是掌握财权的领导,你会对这样的答复买单吗?在需要IT运维部门说真话的时候,由于没有科学的证据,回答问题时没有公信力或者说服力,IT的价值和部门一年的辛苦可能就这样被无辜抹杀了。
最后是做:在这一点上,其实是在回答IT运维部门是做什么的问题。我们要清楚,现代企业的发展已经离不开IT技术的有力支撑,作为增强核心竞争力的法宝,企业不可能停止对IT的投入,但投入的最终目的是为了使业务系统发挥功效,实现利润与收益。在这条价值链上,IT运维管理在做什么呢?如果我们还停留在设备、网络、服务器这种底层监控阶段,无法与业务有机融合,那么不仅在企业的价值链中将永远看不到IT运维的身影,企业也将因为失去IT这一现代商业社会最重要的引擎而失速落败。
IT 运维管理三阶段 RIIL激活IT价值
对于IT运维管理部门来说,采用锐捷网络的RIIL激活IT价值,要做到有章可循,可以分为三个具体的阶段性操作来实现:
第一阶段:用RIIL搭建基础架构管理中心。并通过多种协议方式完成所有设备的采集,形成物理和逻辑拓扑图。模拟管理员日常工作行为,完成对服务器、网络设备、安全产品、数据库、中间件、Web服务、存储设备状态和性能的实时监控,帮助IT运维部门实现IT基础设施管理的可视化和自动化,降低管理复杂度,从而提高对IT基础架构的主动监管能力。
第二阶段:在基础架构管理中心构建完成之后,RIIL还提供了图形化的业务建模工具,用户可以根据实际环境,定义个性化的业务运行评估模型。从底层监控,再到业务视角、用户视角,对被监测资源进行关联、重组,建立真实表达业务内部关系的影响模型图,帮助用户快速搭建业务卡片视图,准确判断业务健康度、繁忙度、业务层级视图和业务告警等内容,客观评估业务运行水平,让IT投入的效益最大化,真正实现IT管理与业务管理的无缝融合。
第三阶段:关注IT整体健康指数,持续优化。要完成这一目标,可以使用RIIL中的一些具体的功能特性,例如RIIL中的IT健康指数。它是一条类似股票大盘的指数曲线, 如果出现下行趋势,则说明企业的IT系统正在变坏,出现了问题。同时与IT健康指数相关联的有一个业务雷达,可以显示出当前健康指数下行是由于哪一个业务系统的健康发生变化造成的,同时可以追溯到是什么IT资源发生了问题。
冯晋阳先生表示:站在业务的角度去做运维,站在科学的角度上去说运维,站在企业价值的角度去呈现运维,这三点就是RIIL能够帮助运维部门提升价值的关键。比如,在RIIL产品中,即使不够专业的用户也可以通过超大屏幕看懂运维数据、直观易懂的业务卡片、IT健康指数等等,这些功能都围绕着IT运维价值呈现这一核心要素。
云计算:拼的是运维
云计算的IaaS、PaaS、SaaS最后那个S都是Service。就是说,无论你云计算长成什么样,都得要向用户提供“服务”而不仅仅是软硬件和各种资源。
【云计算的技术难点】
到今天,云计算的工业实现已经不太难了。现在有开源软件KVM和Xen,这两个东西基本把虚拟化搞定;而OpenStack则把管理、控制系统搞定,也很成熟。PaaS也有相应的开源,比如OpenShift,而Java里也有N多的中间件框架和技术。另外分布式文件系统GFS/TFS,分布式计算系统Hadoop/Hbase等等,分布式的东西都不神秘了。技术的实现在以前可能是问题,现在不是了。
对于云计算工程方面,现在最难的是运维。管100台、1万台还是100万台机器,那是完全不同的。机器少你可以用人管理,机器多是不可能靠人的。运维系统不属于功能性的东西,用户看不见,所以这是被大家严重低估的东西。只要你做大了,就必然要在运维系统上做文章。数据中心/云计算拼的就是运维能力。
为什么说运维比较复杂,原因有这么几个。
一方面,云计算要用廉价设备取代那些昂贵的解决方案。所谓互联网的文化就是屌丝文化,屌丝就是便宜,互联网就是要用便宜的东西搭建出高质量的东西,硬件和资源一定不会走高端路线——比如EMC、IBM小型机、SGI超级计算机等等,你如果用它去搭建云计算,成本太贵。用廉价的解决方案代替昂贵的解决方案是整个计算机发展史中到今天唯一不变的事情。所以如果你要让夏利车跑出奔驰车的感觉,你需要自己动手做很多事,搭建一个智能的系统。用廉价的东西做出高质量的东西,运维好廉价的设备其实是云计算工程里最大的挑战。
另一方面,因为你机器多了,然后你用的又不是昂贵的硬件,所以故障就变成了常态,硬盘、主板、网络天天坏。所以,没什么好想的,运维就必须要跟上。云计算的目标是在故障成为常态的情况下保证高可用——也就是我们所说的,你服务的可用性是3个
9、4个9还是5个9。
最后,这一大堆机器和设备都放在一起,你的安全就是一个挑战,一方面是Security,另一方面是Safety,保证数十台数百台的设备的安全还好说,但是对于数万数十万台的设计,就没有那么简单了。
面对这样的难题,人是无法搞得定的,你只能依靠技术来管理和运维整个平台。比如必须有监控系统。这跟操作系统一样,对资源的管理,对网络流量、CPU利用率、进程、内存等等的状态肯定要全部收集的。收集整个集群各种节点的状态,是必然每个云计算都有的,都是大同小异的。
然后,你还要找到可用性更好的节点,这需要有一些故障自检的功能。比如阿里云就遇到过磁盘用到一定时候就会莫名其妙的不稳定,有些磁盘的I/O会变慢。变慢的原因有可能硬盘不行了,于是硬盘控制器可能因为CRC校验出错需要要多读几次,这就好比TCP的包传过来,数据出错了,需要重新传。在这种硬盘处理半死不活的状态时,你肯定是需要一个自动检测或自动发现的程序去监控这种事情,当这个磁盘可能不行了,标记成坏磁盘,别用它,到别的磁盘上读复本去。我们要有故障自动检测、预测的措施,才能驱动故障,而不是被动响应故障,用户体验才会好。换句话说,我们需要自动化的、主动的运维。
为了数据的高可用性,你只能使用数据冗余,写多份到不同的节点——工业界标准写三份是安全。然而,你做了冗余,又有数据一致性问题。为了解决冗余带来的一致性问题,才有了paxos的投票玩法,大家投票这个能不能改,于是你就需要一个强大的控制系统来控制这些东西。
另外,公有云人来人往,里面的资源和服务今天用明天不用,有分配有释放,有冻结,你还要搞一个资源管理系统来管理这些资源的生命状态。还有权限管理,就像AWS的IAM一样,如果没有像AWS的IAM权限管理系统,AWS可能会不会像今天这样有很多大的公司来用。企业级的云平台,你需要有企业级的运维和管理能力。
【云计算的门槛】
为啥云计算有这么多开源的东西,却不是人人都能做?
一方面,这就跟盖楼一样。盖楼的技术没什么难的(当然,盖高楼是很难的),但是你没地你怎么盖?云计算也一样,带宽的价格贵得就像土地的价格。其实云计算跟房地产一样,要占地、占机房、占带宽。如果能把中国所有的机房、机柜、带宽资源都买了,你就不用做云计算了,卖土地就够了——因为这些是有限的。最简单的例子,IP地址是有限的。你有带宽、有机房,但是如果你没有IP,这就不好玩了。尤其是你要提供CDN服务,这个就更明显,因为有多少物理节点直接决定你的CDN服务质量。
另一方面,正如前面所说的,运维是件很难的事,运维这个事并不是一般人能搞的事。没有足够的场景、经验和时间,这种能力很难出现。
从用户的角度来说呢,云计算是一种服务,你需要对用户企业内的解决方案要有很好的了解,这样才能提高很好的服务。能提供“好服务”的通常都是把自己真正当成用户公司。
卖汽车也是卖服务。造出汽车来,并不代表你搞定这个事了。如果没有公路、没有加油站、没有4s店、没有交通管理、规则等等,你要么用不了,要么就是乱七八糟。不能只让用户在那看着你的汽车好牛啊,但是用户不知道怎么用。所以说,云计算最终旁边必须要有一套服务设施,而这套服务设施也是今天被人低估的。
云计算有两个东西是被人低估的,一个是运维,一个是那堆服务。做服务的需要有生态环境,有人帮你做。所以做云计算要落地并不简单。
总之,云计算是需要吃自己的狗食才能吃出来的,绝不是像手机上的Apps一样,你想一想、试一试就能搞出来的,你首先需要让自己有这样的场景,有这样的经历,你才可能会有这样的经验和能力。 还是那句话,云就是服务,只要提供了好的服务,无论公有还是私有都是会有价值的。
“云安全”解决方案
作者:佚名 文章来源:销售部 点击数:16 更新时间:2014-10-30 10:22:25
从2011年索尼、纽约交易所网站被攻击,到年底CSDN、天涯、人人等大型网站被拖库,继而2012年美国中央情报局网站、我国国防部网站频繁被攻击,乃至到近期发生的新加坡总理网站被入侵„„显而易见,网站一直都是网络攻击、网络犯罪的重灾区。当前的攻击者更专一,更倾向于有价值的目标,政府、企业的网站往往首当其冲。很多用户的信息网络甚至内部的办公、生产系统被入侵,而攻击者们大多都借用了用户的外部网站作为攻击的“跳板”。不夸张的说,网站的安全已经成为信息安全保卫战的第一道防线。
如何应对这些花样繁多,似乎永无休止的安全威胁?这让网站的管理者头疼不已,可对于知道创宇科技来说却不是一个难题。作为一家专注于互联网安全的企业,知道创宇科技在对网站的安全防护上有着非常成熟的经验,他们先后推出了WebSOC网站立体监控系统,KS-WAF网站统一防护系统,Websaber网站应用安全评估系统,为网站提供立体全面的监控和防护。其中加速乐产品为网站提供一站式的加速、安全解决方案,得到了二十多万用户的广泛应用。面对层出不穷的网络攻击,知道创宇科技本着“魔高一尺道高一丈”的精神,潜心研发,创新发展,对产品不断更新换代,力图在这场网站攻防战中抢占先机,牢牢把握主动权。
近日,知道创宇科技产品总监金皓在采访中告诉记者,知道创宇科技将对产品线做重大调整,不仅要对公司的拳头产品WebSOC进行大幅升级改进,还要推出一款明星产品WebTrack,帮助企业用户在愈演愈烈的网络攻击中彻底做到安全无忧。
金皓着重提到,云计算的流行,使得越来越多的攻击开始针对云平台,攻击者现在只要攻破一个云平台,就能获得大量用户的隐私和数据,远高于攻击单个网站所带来的价值。例如10月Adobe确认其云端服务平台遭到黑客攻击,其后曝出的受害用户数量远远高于预计。之后,很多大型网站如Facebook、Yahoo等也被殃及,为了让其用户不受到该攻击的影响,被迫要求部分用户修改密码。
现在云平台使用的很多第三方组件都存在漏洞,安全情况堪忧。针对这种趋势,新版的WebSOC集成了大量的POC漏洞验证规则,以接近黑客的攻击思路,堵住了来自第三方应用组件的漏洞,对云平台的防护又更进一步。
如果说在网站的防护上,WebSOC已经做到无所不在的监控,那么,对于针对网站的种种攻击和可疑行为,怎么样知道它们要做什么?或者是已经做了什么?它们到底来自哪里?用户该如何判断? 对此,知道创宇科技也有应对良方。金皓透露道,知道创宇科技于12月推出一款全新的产品WebTrack,它能对行业、区域的整体安全进行统计及态势分析,通过自带的IP信誉档案库,可以对黑客建档、取证及追踪,实现行业、区域的统一管理,还可以进行虚拟补丁的快速分发,从而给用户提供持续在线的保障能力。
为什么要在这个时候推出WebTrack?据金皓介绍,WebTrack的技术基础是奠定在加速乐产品在二十多万个互联网网站的大规模应用上,而当前政府和行业网站的严峻局面,也促使了WebTrack的诞生。区别于单一的网站安全防护产品,WebTrack的定位是综合性网站防御体系平台。它采用了在实践中已验证成熟的架构,更侧重于网站的安全性,主要面向区域性的、行业性的政府、企业用户。
WebTrack系统可以记录所有被保护网站的被攻击日志,通过搭建数据中心,可纵向查看网站所有历史数据,并可横向查看相同类型事件的多网站关联数据,以实现对这些数据进行的离线三维关联及聚类分析,最终从众多线索中追溯攻击源头。同时,对行业和区域整体安全环境进行保护、分析和预警。单个网站的防护也因在整体安全态势的大背景下更易发现风险,并及时作出相应策略。
金皓进一步对WebTrack进行了解读。他比喻道,网络上的攻击态势对众多用户来说,更像是进行一场网络反恐战争。用户非常需要知道攻击者从何而来,对什么信息感兴趣,做了哪些行为,此时WebTrack就相当于一个综合防御系统。 首先是预警功能。得益于加速乐等产品的大规模应用,知道创宇科技建立并不断更新着一个庞大的IP信誉档案库,一经发生网络攻击,就可以从源头上进行判断,提出预警。
接着是第二道防线,对正常IP所产生的行为,通过各种规则进行安全防护。知道创宇科技通过对海量的网站攻击数据的分析建模,建立了各种数据库,如黑客档案库和他们常用的攻击手法,攻击代码特征库,以及各种应用的漏洞库等等。这些数据库生成了各种防护规则,并实时下发更新。如果流量出现异常,就可以通过规则关联匹配,判断这个行为是否有恶意动机,从而做出正确判断。
最后,系统具备完善的日志分析功能。如果攻击者利用了未知漏洞或者其他因素成功进行了攻击,系统会通过日志分析做深度的挖掘,将这些隐藏的恶意行为曝光出来,并记录在案,反馈到知道创宇的云平台,确保类似的行为不会再次得逞,并且不会在别的地方发生。值得称道的是系统对所有的攻击行为都可以追查源头,这对很多用户来说是一个非常有用的功能
政府办公桌面虚拟化解决方案
政府单位业务系统众多,且往往涉及到国家机密信息。政府单位的桌面IT系统面临着数据安全性、桌面系统维护、业务连续性保障等诸多挑战需要解决:
1、数据安全性有待提升。办公人员的工作内容往往会涉及到机密信息,需要进行有效的数据安全性防护;但众多的终端PC却很容易导致出现移动磁盘拷贝、黑客盗取信息等数据泄密渠道,影响到机密数据的安全;
2、桌面终端系统维护困难。接入办公网络的终端数量众多,在当前大量使用PC的情况下,所有终端的操作系统、补丁升级、业务软件都需要在每台PC上分别实施,耗费巨大的人力物力,费时费力,效率低下;
3、业务连续性缺乏保障。由于终端数量众多,安全保障任务艰巨。而终端PC是最容易被病毒、木马攻击的对象,一旦某台PC被攻击就可能导致整个办公网络的业务系统崩溃;
方案设计
基于以上对政府单位的终端桌面系统的问题和需求分析,我们推荐采用北京东方荣华有限公司的桌面虚拟化解决方案,从而有效防止关键数据和信息泄密,大幅提升终端的IT运维效率,实现业务连续性保障和节能减排等目标。
方案设计目标
1、数据和信息安全:通过桌面虚拟化方案,单位所有人员使用的桌面系统及业务系统都集中在数据中心运行,所有业务工作实际保存、运行在数据中心的服务器,用户只能远程看到运行程序的图像,大大保证数据的安全;另外,管理员通过应用内置的安全策略,可以让用户无法将文件和信息保存在本地设备或移动磁盘上,防止机密数据随便被拷贝造成的泄露,从而有效实现数据安全和信息安全;
2、终端管理维护方便:通过桌面虚拟化方案,单位可以通过虚拟桌面池、虚拟桌面模板克隆等技术实现快速桌面部署,单位所有的终端设备使用的操作系统全部来自一个由管理员定制的标准化操作系统,该镜像中已安装了业务所需要的应用程序及应用客户端软件,对于前端客户端的桌面与应用维护工作量,就缩小到只需对一个镜像进行维护。另外,桌面和应用的安装和升级等全部在集中数据中心进行,IT管理员无需接触最终用户的客户端,就可以完成应用的配置和维护工作,避免每台PC机装机,以及故障时重装等,大大减少维护工作量,提升效率;而终端由PC替换为云终端后,其本身不用安装应用软件,可以做到在运行期间终端免维护,降低终端维护成本;
3、业务连续性保障:桌面虚拟化方案可以在服务器端对业务系统和所有终端进行快照、备份等技术部署,从而将意外故障停机时间和恢复时间降到最低;此外,解决方案采用本地无操作系统和应用软件的云终端,极大的降低了由于病毒入侵或是办公人员对操作系统的非法操作引起的办公网络崩溃或是系统宕机的风险,提高了电子政务系统的高可用性及高可靠性。
4、防止数据丢失与损坏 :所有业务数据文件都统一保存在数据中心,由IT人员统一进行管理、定期备份与恢复,从而避免终端用户个人保管不当造成的数据损坏和丢失;
5、节省办公空间:通过桌面虚拟化方案,可以用云终端来替代传统PC;而云终端体积小,可以通过螺钉直接固定在显示器后面,节省办公空间,相同办公区域内可以容纳更多的办公人员;
6、降低终端持续更新费用:PC机平均更换周期为3~5年,而云终端如无人为损坏,工作时间平均为10年左右;服务器的使用寿命也远高于PC机;虚拟化软件License可以永久使用;
7、持续扩容费用低:后续增加办公人员,无需采购PC机,只需要按需采购云终端即可。扩容服务器处理能力时,可通过扩充CPU和内存来实现。
8、节约能耗,绿色IT:云终端能耗低(小于10W,平均5W),云终端+服务器方式比传统PC机节约能耗约75%,绿色环保。