倾情大奉送--Spark入门实战系列
这一两年Spark技术很火,自己也凑热闹,反复的试验、研究,有痛苦万分也有欣喜若狂,抽空把这些整理成文章共享给大家。这个系列基本上围绕了Spark生态圈进行介绍,从Spark的简介、编译、部署,再到编程模型、运行架构,最后介绍其组件SparkSQL、Spark Streaming、Spark MLib和Spark GraphX等。文章内容的整理一般是先介绍原理,随后是实战例子。
【内容大纲】
1.Spark及其生态圈简介
2.Spark编译与部署(上)--基础环境搭建
2.Spark编译与部署(中)--Hadoop编译安装
2.Spark编译与部署(下)--Spark编译安装
3.Spark编程模型(上)--编程模型及SparkShell实战
3.Spark编程模型(下)--IDEA搭建及实战
4.Spark运行架构
5.Hive(上)--Hive介绍及部署
5.Hive(下)--Hive实战
6.SparkSQL(上)--SparkSQL简介
6.SparkSQL(中)--深入了解运行计划及调优
6.SparkSQL(下)--Spark实战应用
7.Spark Streaming(上)--实时流计算Spark Streaming原理介绍
7.Spark Streaming(下)--实时流计算Spark Streaming实战?
8.Spark MLlib(上)--机器学习及SparkMLlib简介?
8.Spark MLlib(下)--机器学习库SparkMLlib实战
9.Spark图计算GraphX
10.分布式内存文件系统Tachyon介绍及安装部署
相关资源