课程特色 :7X24小时不间断运行系统一般为大规模复杂系统(如:航天系统、通讯系统、计算机网络系统、金融系统等等)已在各行各业广泛应用,并在人民群众的生产生活、社会经济的运行中扮演着极其重要的作用。如果系统发生系统故障,社会影响较大。因此,确保系统安全稳定运行是运维工作中的重中之重。但是近年来,业界发生重大系统故障的情况已屡见不鲜。纵观每一起系统故障事件,可以看出,7X24小时不间断运行系统运维工作本身具有技术和知识密集程度高,运维过程的操作标准不统一,运维过程难以控制的特点。因此,业界的控制措施主要集中在事故发生后的应急处理方面。但是,由于7X24小时不间断运行系统具有”生产即交付”的特点,事后应急往往为时已晚,经济损失和社会负面影响已不可挽回。这已经成为业界之痛。本课程是专门针对需要7X24小时不间断运行系统的运维管理工作而设立的,突破性地解决了不间断运维工作中生产过程难以控制这一难点,实现了在7X24小时运行系统运维工作中的事前预警、事中监控与防错,解决了7X24小时不间断运行系统的运维工作面临的事后应急往往为时已晚的业界之痛。课程通过分析不间断运行系统的运维工作的特性及生产过程特点,聚焦于消除运维过程中的人为事故,对运维过程进行识别和标准化,对运维工作执行标准进行监控,并持续优化。以此形成构建7X24小时不间断运行系统运维管理体系的方法,建立起7X24小时不间断运行系统无人为事故运维管理体系。本课程所构建的运维管理体系曾多次获奖,包括:亚洲质量奖、银行科技发展奖(省部级)、中质协质量技术奖等,同时还获得了国家自然科学基金的支持(项目号:70802059)。本课程知识覆盖全面,涵盖了复杂系统理论、WSR理论、TRIZ理论、分形理论、6SIGMA理论,以及IT审计方法、PokaYoke方法、交叉渗透方法、过程识别方法、i\o分析方法、FMEA等等。本课程所有内容讲解都配套了在运维工作中已经实际应用的成功案例,使所有的知识点都能得到印证和落地,直观、细致,提高经验积累。课程结束后提供给学员完备的资料,以便学员在各方面的巩固及积累。培训对象 :1、7X24小时不间断运行的系统运维人员,管理人员、系统研发人员及相关的其它人员。2、对确保系统或其他持续运维工作安全稳定运行有需求及感兴趣的人员。3、学习本课程的学员需具备系统运维方面一定的认知。课程目标:1.掌握复杂系统理论的相关知识内容,并学会在运维工作中运用;2.掌握WSR系统方法及工作过程;3.理解分形理论的基本原理及对运维工作的影响;4.掌握建立7X24不间断运行系统无人为事故运维体系的方法,并到达可以实施的水平;5.掌握“过程因子失效率”量化考核指标体系的建立方法及实施方法;6.掌握6SIGMA基本理论,并学会SIPOC、I\O分析、FMEA三种工具的应用方法;7.掌握海恩法则与墨菲定律的本来原理及对运维工作的影响;8.掌握双归零理论的工作方法,并学会在运维工作中的具体实施步骤;9.掌握TRIZ的基本原理及工作过程,学会用TRIZ的方法完善运维工作;10.掌握IT审计的工作过程,并到达可以灵活应用于运维工作之中的水平;11.了解共享心智模型对于运维工作的影响,并学会提升运维人员心智模型相似性的方法;12.理解课程中介绍的所有成功运维应用实例并学会活用。授课专家:王老师毕业于中国科学院研究生院在某国有大型金融机构数据中心从事运维管理工作10年以上;一直致力于确保7X24小时不间断运行系统的安全稳定运维工作;工作及研究成果曾得省部级奖,并获得国家自然科学基金支持;通过了中国质量协会、美国质量学会双重注册六西格玛黑带认证的考试、拥有TRIZ、IOS27001、90001、ITIL等技术认证。培训大纲 :第一讲:7X24不间断运维的需要解决的问题1.1 7X24不间断运行系统特点1.1.1 7X24不间断运行系统运维工作的复杂性特点1.1.2 7X24小时不间断运行系统具有”生产即交付”的特点1.1.3 确保7X24小时不间断运行系统安全稳定运行是重中之重。1.2 业界之痛,触目惊心1.2.1 7X24小时不间断运行系统发生故障的巨大影响1.2.2 如何解决不间断运行系统运维过程难以控制的业界之痛?第二讲:无人为事故运维体系探索之路及成果展示2.1 用WSR理论消除人机交互中的事故隐患2.1.1 复杂系统及其方法2.1.2 为何WSR(国家自然科学基金项目)2.1.3 WSR在7X24小时不间断系统运维工作中的成功应用2.2 用分形理论着眼运维细节,使系统总体可控2.2.1 分形理论基本原理2.2.2 经典的整体论和还原论对于运维工作的局限性2.2.3 分形理论的重大发现对运维工作具有重要的意义2.3 用TRIZ理论集各方所长,确保系统安全稳定运行2.3.1 TRIZ的诞生和发展2.3.2 TRIZ理论的基本哲理及引申含义2.3.3 TRIZ理论给运维工作带来的新希望2.4 构建 7X24小时不间断运行系统无人为事故运维管理体系2.4.1 无人为事故运维体系探索之路2.4.2 7X24不间断运行系统的生产与传统产业的服务的特点比较2.4.3 7X24小时不间断运行系统无人为事故运维管理体系模型2.4.4 7X24小时不间断运行系统无人为事故运维体系建立步骤2.4.5 “双核三部曲”之过程识别三部曲2.4.6 “双核三部曲”之监控点识别三部曲2.5 体系衡量标准“过程因子失效率”2.5.1 过程因子失效率测量机制2.5.2 过程因子失效率测量系统建立方法2.5.3 过程因子失效率测分析及优化方法2.5.4 过程因子失效率测运维成功应用实例及成果展示第三讲:体系中必须融入的管理方法和应用实例(武技篇)3.1 牢记海恩与墨菲,有效预防千里之堤毁于蚁穴 3.1.1 海恩法则的基本原理3.1.2 海恩法则的两个核心思想3.1.3 如何在运维工作中做到以预防为主?3.1.4 不间断运行系统无人为事故运维管理体系的核心思想3.1.5 墨菲定律的基本原理3.1.6 海恩墨菲对运维工作的警示及应用实例3.2 熟知6sigma中有三宝,运维一个都不能少3.2.1 6sigma理论的基本原理3.2.2 SIPOC / 价值流图的绘制方法3.2.3 输入/输出分析法详细解析3.2.4 因果矩阵的制作方法3.2.5 详细流程图的绘制方法3.2.6 失效模式分析(FMEA)法详细解析3.2.7 运维工作中6SIGMA成功项目实例(节选) 3.3 玩转TRIZ理论,打开运维无事故武器库的金钥匙 3.3.1 TRIZ能为运维做什么? 3.3.2 TRIZ理论的核心思想3.3.3 TRIZ解决问题的流程3.3.4 矛盾矩阵的使用方法解析3.3.5 TRIZ在运维中的成功应用实例3.4 落实“双归零”,让事事有始有终可追溯3.4.1 “双归零”的含义及基本原理3.4.2 技术归零的方法及步骤3.4.3 技术归零报告详细解析3.4.4 管理归零的步骤及步骤3.4.5 管理归零报告详细解析3.4.6 “双归零”在运维工作中的成功应用实例3.5 活用运维审计,把运维事故消灭在萌芽阶段3.5.1 IT审计的含义及内容3.5.2 IT审计框架体系建立3.5.3 如何在运维工作中活用IT审计?3.5.4 IT审计在运维中的成功应用实例3.6 掌握共享心智模型,一线运维再无慌乱(国家自然科学基金项目)3.6.1 共享心智模型的基本原理3.6.2 基于共享心智模型的快速提高员工综合能力的结构化方法3.6.3 共享心智模型在运维工作中的成功应用实例第四讲:配套量化考核指标体系的构建方法 4.1 配套量化考核指标体系的设计思路4.2 运维工作中配套量化考核指标体系的成功应用实例