课程名称:数据挖掘和数据统计分析技术
师资:
由业界知名大数据专家亲自授课:
杨老师 主要研究网络信息分析以及云计算相关技术,长期从事通信网管系统、网络信息处理、商务智能(BI)以及电信决策支持系统的研究开发工作,主持和参与了多个国家和省部级基金项目,具有丰富的工程实践及软件研发经验。
培训内容:
第一讲 数据挖掘,Python和R简介
1.1数据挖掘
1.2Python语言
1.3 R语言
1.4 Iris数据集
1.5 Bodyfat数据集
第二讲 数据的导入与导出
2.1 R数据的保存与加载
2.2 CSV文件的导入与导出
2.3 通过ODBC从数据库中读取数据
2.4 从Excel中导入与导出数据
2.5 Python的数据操作
第三讲 数据可视化展现
3.1 查看数据
3.2 单个变量展现
3.3 多个变量展现
3.4 更多探索
3.5 将图表保存到文件中
第四讲 决策树与随机森林
4.1 使用party包构建决策树
4.2 使用rpart包构建决策树
4.3 随机森林
4.4 Python中的决策树实现
4.5 Python决策树实例
第五讲 回归分析
5.1 线性回归
5.2 逻辑回归
5.3 广义线性回归
5.4 非线性回归
5.5 Python中的回归实现
5.6 Python回归实例
第六讲 聚类分析
6.1 k-means聚类
6.2 k-medoids聚类
6.3 层次聚类
6.4 基于密度的聚类
6.5 Python中的聚类实现
6.6 Python聚类实例
第七讲 离群点检测
7.1单变量的离群点检测
7.2局部离群点因子检测
7.3用聚类方法进行离群点检测
7.4时间序列数据的离群点检测
7.5 Python中的孤立点实例
第八讲 时间序列分析
8.1 R中的时间序列数据
8.2 时间序列分解
8.3 时间序列预测
8.4 时间序列聚类
8.5 时间序列分类
8.6 Python中的时间序列实例
第九讲 关联规则
9.1 关联规则的基本概念
9.2 Titanic数据集
9.3 关联规则挖掘
9.4 消除冗余
9.5 解释规则
9.6 关联规则的可视化
9.7 Python中的关联规则实例
第十讲 社交网络分析
10.1 词项网络
10.2 推文网络
10.3 双模式网络
10.4 Python中的社交网络分析实例
培训目标:
1, 全面了解Python和R语言数据挖掘的相关知识。
2,学习Python和R的数据挖掘核心技术方法以及应用特征。
3,深入使用Python和R在数据挖掘和分析中的使用。