R是一套完整的数据处理、计算和制图软件系统。是一个免费的自由软件,它有UNIX、LINUX、MacOS和WINDOWS版本,都是可以免费下载和使用的,
在那儿可以下载到R的安装程序、各种外挂程序和文档。在R的安装程序中只包含了8个基础模块,其他外在模块可以通过CRAN获得。R既是功能强大的统计和分析软件,
同时也是完美的数据可视化制作工具,丰富的图形函数和外置包,几乎无限的扩展能力,使到我们的想象空间永远都不会达到上限
2011年统计的数据分析软件使用率情况,R语言多项雄踞首位,是最热门的分析利器
《数据分析、展现与R语言》课程介绍如下:
本课程糅合了之前所开的《数据分析与R语言》《R语言进阶——数据展现》两门课的精华,去除部分较为艰涩的内容,增加更具有实战价值的知识,是过往有关课程的升级改进版。在进度上,把较难掌握的算法和建模部分与相对较为容易的数据展现部分相间,使到学习者有更多的时间去理解吸收建模知识,这也是通过过往课程得出来的经验,有望可以达到更好的学习效果。
授课对象:
这是一门数学+IT的课程,适合已经有一定的IT基础,但对数据分析行业尚不了解的朋友进修学习。
授课时间:
本期期课程预计2014年12月22日开课,预计课程持续15周
授课讲师:
tigerfish,ITPUB创始人,中山大学海量数据与云计算研究中心主任。数据库专家,数据分析专家,有丰富的IT领域、数学领域的知识经验。他将带领他的数据分析团队完成整个授课工作。
学习收获预期:
算法有一定的了解,有一定的使用R语言解决问题的能力,并且熟练地使用R做出精美的图表
-------------------课程目录-------------------
1 基础数据分析知识,包括一些概率统计里的概念、术语,和基本统计量的计算方法等。2 一些常用的数据分析和数据挖掘算法,以及有关的各种领域里的实际应用案例分析
3 世界最流行的开源数据分析软件R及其编程方法
4 数据展现,介绍R及其强大的图表功能
第1课 R语言基础:R简介,变量,向量,数组,矩阵,数据框,读写文件,控制流
第2课 R语言基础:R的数据可视化,各种图表,常用统计量计算
第3课 预知未来的回归模型:随机变量,密度函数,一元线性回归模型
第4课 预知未来的回归模型:多元线性回归模型
第5课 数据展现:基本制图函数综述
第6课 预知未来的回归模型:logistic回归,广义线性回归,非线性回归
第7课 数据展现:理解关键制图参数
第8课 挖掘关联和推荐技术:MINE方法,apriori购物篮分析
第9课 数据展现:散点图
第10课 万事皆选择:分类算法,线性判别法,贝叶斯分类器,决策树,最近邻算法
第11课 数据展现:线图与时间序列谱图
第12课 数据展现:柱形图,点图,饼图,直方图
第13课 万事皆选择:聚类算法,层次聚类法,谱系图,k平均值法,k中心法
第14课 数据展现:箱线图,热力图,等高线,地图,转换为图形文件
第15课 大道至简:降维技术,主成分分析和因子分析
相关资源