课程名称:基于Spark和Hadoop的规模化数据科学
基于Spark和Hadoop的规模化数据科学
时长:3天
课程概述:了解数据科学家的工作内容、需要解决的问题以及其处理现实问题时应用的方法, 以获得来自不同行业数据的业务价值。实施自动推荐系统。
培训对象:面向具备 Hadoop 基础知识(HDFS、MapReduce、Hadoop Streaming、Hive)
的工程师、数据分析师、统计人员。培训对象应具备熟练的脚本语言能力:Python 是;熟悉Perl或者Ruby也可。