华为大数据 HCIE-Big Data课程介绍HCIE-Big Data认证定位于大数据分析领域中大型分布式并行处理数据仓库平台的架构原理、优化设计、应用开发和大数据挖掘领域的基础理论、常用挖掘算法、应用设计以及开发,旨在推动业界大数据行业的专家型人才培养。HCIE-Big Data认证包括但不仅限于:(1)华为企业级的大型并行处理分布式数据仓库平台FusionInsight LibrA的架构、功能特性、数据库设计、数据库数据导入导出、数据库调优及数据库开发等;(2)数据挖掘的理论(包括数据预处理、数据仓库、分类、聚类、关联规则等)以及使用华为企业级大数据挖掘平台FusionInsight Miner和基于华为云的企业智能平台EI (Enterprise Intelligence)的基础服务 - MLS (Machine Learning Service,机器学习服务)进行数据深度分析和挖掘。通过HCIE-Big Data认证,将证明您系统理解并掌握大型并行处理数据仓库平台的架构原理、分布式关系型数据库的设计和优化及应用开发;掌握大数据挖掘的基本原理,常用算法、常用挖掘方法、对华为大数据挖掘解决方案FusionInsight Miner和华为云机器学习服务MLS的熟练使用,胜任数据仓库开发、大数据分析、大数据数据挖掘和人工智能的相关岗位。 企业拥有HCIE-Big Data 认证的工程师,意味着企业掌握了运用大数据技术进行大数据分析应用、大数据挖掘应用的能力。大数据知识点: 一章 数据仓库平台FusionInsight LibrA(理论) 第 一节 分布式数据库架构 体系架构基本知识 熟悉MPP架构及优势 业界产品说明 第二节 FusionInsight LibrA 基本组件简介 LibrA逻辑架构 LibrA物理架构 LibrA数据库对象 第三节 FusionInsight LibrA 产品特性和关键技术 架构和支持的操作系统 面向应用开发的基本功能 数据库安全 图形化工具 高级特性 第四节 FusionInsight LibrA 配套工具集 Database Manager概念与架构 Database Manager的安装 Database Manager的使用 Data Studio概念与架构 Data Studio的安装与FusionInsight LibrA服务器的配置 Data Studio工具支持的特性 Data Studio的使用 第五节 FusionInsight LibrA 安全管理 访问控制 用户管理 权限管理模型 对象权限 安全审计 第六节 FusionInsight LibrA 数据库管理系统并发控制 配置负载均衡 事务与隔离 LibrA锁机制介绍 第七节 FusionInsight LibrA 数据库性能监控 系统资源监控方式 性能相关视图 使用命令行监控集群性能 使用DM工具监控集群性能 第八节 FusionInsight LibrA 数据迁移 数据迁移场景划分 GDS工具适用场景和使用方法 Copy from/to适用场景和使用方法 开源ELT工具适用场景和使用方法 gs_dump/gs_restore适用场景和使用方法 gsql工具适用场景和使用方法 Roach工具适用场景和使用方法 从其他数据库中迁移数据 第九节 FusionInsight LibrA SQL介绍 SQL相关机制和原理 利用EXPLAIN进行SQL调优 第十节 FusionInsight LibrA 数据库设计 数据库逻辑设计 存储模式 数据分布 表分区 索引 第十一节 FusionInsight LibrA 应用程序开发指导 FusionInsight LibrA驱动介绍 ODBC应用程序开发 JDBC应用程序开发 基础开发规范第二章 FusionInsight LibrA(实验) FusionInsight LibrA基本操作、语法 FusionInsight LibrA性能优化 网络KPI数据栅格化处理 重点区域数据分析 流动人口常驻地分析第三章 大数据挖掘理论 第一节 预备知识和数据介绍 数据挖掘的定义 数据挖掘的流程 数据挖掘的应用 数据和属性类型 数据的统计描述 数据的邻近性度量 第二节 数据预处理 为什么要预处理数据 数据清理 数据集成 数据归约 数据变换 第三节 数据仓库介绍 数据仓库的概念 数据仓库的体系结构与模型 多维数据模型 概念分层 OLAP与OLTP 方体物化 第四节 分类 分类和回归的概念 决策树分类 朴素贝叶斯分类 组合分类 后向传播分类 支持向量机分类 模型评估与选择 第五节 聚类 聚类的定义 K-均值算法 k-中心点算法 第六节 离群点检测 离群点的概念 离群点检测的方法 第七节 关联规则(Association Rule) 关联规则的定义 关联规则挖掘步骤及相关概念 关联规则挖掘方法分类 Apriori算法 第八节 FusionInsight Miner 和华为云机器学习服务MLS FusionInsight Miner整体介绍 关系分析 标签管理 华为云机器学习服务第四章 大数据挖掘实战 银行定期存款业务预测 客户分群 鲍鱼生长年龄预测认证考试HCIE-Big Data 证书有效期与重认证方式有效期:二年重认证项目:在认证过期之前,通过目前提供的任意一门HCIE 笔试或实验或面试。华为重认证项目详情请参考手册中对“华为重认证策略”的说明