Python是一种面向对象、直译式计算机程序设计语言。也是一种功能强大而完善的通用型语言,已经具有十多年的发展历史,成熟且稳定。Python 具有脚本语言中丰富和强大的类库,足以支持绝大多数日常应用。 Python语法简捷而清晰,具有丰富和强大的类库。它常被昵称为胶水语言,它能够很轻松的把用其他语言制作的各种模块(尤其是C/C++)轻松地联结在一起。 2012年的时候我们说R是学术界的主流,但是现在Python正在慢慢取代R在学术界的地位。 从多年13.3%的使用率到多年30.3%的使用率, Python已经逐渐成为数据分析与挖掘软件的中流砥柱。所以,让我们一起来跟随课程的脚步,感受Python的魅力吧! 课程将从Python的基本使用方法开始,一步步讲解,从ETL到各种数据分析方法的使用,并结合实例,让学员能从中借鉴学习。 课程大纲: 第一部分. Python基础 第一课:Python的概览——Python的基本介绍、安装与基本语法、变量类型与运算符 第二课:了解Python流程控制——条件、循环语句与其他语句 第三课:常用函数——函数的定义与使用方法、主要内置函数的介绍 第四课:NumPy基础——数组的创建、组合与分割 第二部分 数据分析的准备 第五课:了解数据——数据加载、储存与文件格式;异常值的清理与缺失值处理 第六课:数据清洗与初步分析——数据清理、转换、合并与重塑;数据汇总与描述统计; 第七课:绘图与可视化——基本绘图命令与图形概览、图形元素设定与实例:地震危机数据的可视化 第八课:数据聚合与分组处理——数据聚合、分组运算与转换、透视表与交叉表 第三部分 数据分析初探 第九课:假设检验——常用假设检验与实例分析 第十课:线性回归——线性回归模型、分析结果呈现与解读;实例:商品价格预测 第十一课: logistic回归——logistic回归模型讲解;实例:电信客户流失分析 第十二课:时间序列分析——时间序列基本处理、时间序列模型构建与结果解读;实例:未来股票价格预测 第四部分 深入数据分析 第十三课:分类算法——knn、决策树、贝叶斯分类器等算法介绍;实例:网页注册用户预测 第十四课:聚类算法——k-means算法介绍;实例:通信基站聚类分析 第十五课:降维方法——主成分分析与因子分析算法介绍;实例:地区经济指标评分 授课对象: 对数据分析感兴趣的、对Python感兴趣的学员;想要学习Python的基础数据分析方法的学员 预期收获: 了解Python的基本用法;懂得使用Python进行基本的数据分析