课程名称:华为大数据 HCIE-Big Data
华为大数据 HCIE-Big Data课程介绍
HCIE-Big Data认证定位于大数据分析领域中大型分布式并行处理数据仓库平台的架构原理、优化设计、应用开发和大数据挖掘领域的基础理论、常用挖掘算法、应用设计以及开发,旨在推动业界大数据行业的专家型人才培养。
HCIE-Big Data认证包括但不仅限于:(1)华为企业级的大型并行处理分布式数据仓库平台FusionInsight LibrA的架构、功能特性、数据库设计、数据库数据导入导出、数据库调优及数据库开发等;(2)数据挖掘的理论(包括数据预处理、数据仓库、分类、聚类、关联规则等)以及使用华为企业级大数据挖掘平台FusionInsight Miner和基于华为云的企业智能平台EI (Enterprise Intelligence)的基础服务 - MLS (Machine Learning Service,机器学习服务)进行数据深度分析和挖掘。
通过HCIE-Big Data认证,将证明您系统理解并掌握大型并行处理数据仓库平台的架构原理、分布式关系型数据库的设计和优化及应用开发;掌握大数据挖掘的基本原理,常用算法、常用挖掘方法、对华为大数据挖掘解决方案FusionInsight Miner和华为云机器学习服务MLS的熟练使用,胜任数据仓库开发、大数据分析、大数据数据挖掘和人工智能的相关岗位。
企业拥有HCIE-Big Data 认证的工程师,意味着企业掌握了运用大数据技术进行大数据分析应用、大数据挖掘应用的能力。
大数据知识点:
一章 数据仓库平台FusionInsight LibrA(理论)
第 一节 分布式数据库架构
体系架构基本知识
熟悉MPP架构及优势
业界产品说明
第二节 FusionInsight LibrA 基本组件简介
LibrA逻辑架构
LibrA物理架构
LibrA数据库对象
第三节 FusionInsight LibrA 产品特性和关键技术
架构和支持的操作系统
面向应用开发的基本功能
数据库安全
图形化工具
高级特性
第四节 FusionInsight LibrA 配套工具集
Database Manager概念与架构
Database Manager的安装
Database Manager的使用
Data Studio概念与架构
Data Studio的安装与FusionInsight LibrA服务器的配置
Data Studio工具支持的特性
Data Studio的使用
第五节 FusionInsight LibrA 安全管理
访问控制
用户管理
权限管理模型
对象权限
安全审计
第六节 FusionInsight LibrA 数据库管理系统并发控制
配置负载均衡
事务与隔离
LibrA锁机制介绍
第七节 FusionInsight LibrA 数据库性能监控
系统资源监控方式
性能相关视图
使用命令行监控集群性能
使用DM工具监控集群性能
第八节 FusionInsight LibrA 数据迁移
数据迁移场景划分
GDS工具适用场景和使用方法
Copy from/to适用场景和使用方法
开源ELT工具适用场景和使用方法
gs_dump/gs_restore适用场景和使用方法
gsql工具适用场景和使用方法
Roach工具适用场景和使用方法
从其他数据库中迁移数据
第九节 FusionInsight LibrA SQL介绍
SQL相关机制和原理
利用EXPLAIN进行SQL调优
第十节 FusionInsight LibrA 数据库设计
数据库逻辑设计
存储模式
数据分布
表分区
索引
第十一节 FusionInsight LibrA 应用程序开发指导
FusionInsight LibrA驱动介绍
ODBC应用程序开发
JDBC应用程序开发
基础开发规范
第二章 FusionInsight LibrA(实验)
FusionInsight LibrA基本操作、语法
FusionInsight LibrA性能优化
网络KPI数据栅格化处理
重点区域数据分析
流动人口常驻地分析
第三章 大数据挖掘理论
第一节 预备知识和数据介绍
数据挖掘的定义
数据挖掘的流程
数据挖掘的应用
数据和属性类型
数据的统计描述
数据的邻近性度量
第二节 数据预处理
为什么要预处理数据
数据清理
数据集成
数据归约
数据变换
第三节 数据仓库介绍
数据仓库的概念
数据仓库的体系结构与模型
多维数据模型
概念分层
OLAP与OLTP
方体物化
第四节 分类
分类和回归的概念
决策树分类
朴素贝叶斯分类
组合分类
后向传播分类
支持向量机分类
模型评估与选择
第五节 聚类
聚类的定义
K-均值算法
k-中心点算法
第六节 离群点检测
离群点的概念
离群点检测的方法
第七节 关联规则(Association Rule)
关联规则的定义
关联规则挖掘步骤及相关概念
关联规则挖掘方法分类
Apriori算法
第八节 FusionInsight Miner 和华为云机器学习服务MLS
FusionInsight Miner整体介绍
关系分析
标签管理
华为云机器学习服务
第四章 大数据挖掘实战
银行定期存款业务预测
客户分群
鲍鱼生长年龄预测
认证考试
HCIE-Big Data 证书有效期与重认证方式
有效期:二年
重认证项目:在认证过期之前,通过目前提供的任意一门HCIE 笔试或实验或面试。华为重认证项目详情请参考手册中对“华为重认证策略”的说明