人人都爱数据科学


人人都爱数据科学


课程特色:

明星讲师。诸多免费课程热力遍布全网,五星口碑爆棚;

规划全面。涵盖基础知识、爬虫采集、数据处理、可视化、数据建模,难得一见的Python体系全面数据科学课程,起步之路有高度;

精品质量。课程设计环节紧凑,循循善诱;课堂教学如行云流水,让人受益匪浅;

 

 

讲师介绍:

丘祐玮(David Chiu) – 大数软件(LargitData)创办人,是一位致力于提供舆情分析服务的创业者与数据科学家,熟悉Hadoop,Spark 等大数据平台,及擅长使用R,Python与机器学习技术进行数据分析。曾任多家上市公司顾问及担任知名大数据应用程序竞赛的评审,已编著MachineLearning With R Cookbook [Packt] 与 R Cookbook [Packt] 二书。

 

课程大纲:

第一章:Python与数据科学应用

1.数据科学简介与应用

2.Python与数据科学

3.安装Anaconda

4.使用Jupyter Notebook

5.Python 3语法快速简介

6Python 資料分析套件 - Pandas 簡介

7.数据科学步骤详解

8.实战范例 - 使用Python计算文章中的字词频率

 

第二章:数据搜集实例

1.数据型态

2.结构化vs半结构化vs非结构化资料

3.Python IO与档案处理

4.处理CSV, Excel格式资料

5.处理JSON, XML格式资料

6.撰写网路爬虫搜集网路资料

7.实战范例 - 房天下(Fang.com)屋价资料搜集

 

第三章:资料清理(I)

1.资料清理概论

2.简介Pandas -使用Pandas处理资料

3.资料筛选

4.侦测遗失值

5.补齐遗失值

6.实战范例 - 房屋资料处理

 

第四章:资料清理(II)

1.资料转换

2.处理时间格式资料

3.重塑资料

4.学习正规表达式

5.实战范例 - 新闻资料处理

 

第五章:资料探索与资料视觉化

1.使用Pandas产生叙述性统计

2.如何使用Pandas绘制统计图表

3.实战范例 - 网页浏览纪录资料分析

 

第六章:资料储存实例

1.关联式资料库- SQLite简介

2.将资料储存至资料库中

3.使用SQL Query分析结构化资料

4.实战范例 - 汇率资讯储存与管理

 

第七章:使用机器学习建立数据模型(回归模型)

1.机器学习基础

2.Scikit-Learn套件简介

3.监督式学习与非监督式学习

4.回归分析

5.回归模型评估

6.实战范例 - 使用回归模型分析房屋价格

 

第八章:使用机器学习建立数据模型(分类模型)

1.资料分类-决策树

2.资料分类- Logistic Regression

3.资料分类- SVM

4.资料分类-类神经网路

5.资料分类-随机森林

6.实战范例 - 使用分类模型预测客户流失

 

第九章:使用机器学习建立数据模型(验证模型)

1.混淆矩阵(Confusion Matrix )与其意义

2.交叉验证(Cross Validation)

3.使用ROC评估不同分类模型

4.实战范例 - 评估不同客户流失分析模型

 

第十章:使用机器学习建立数据模型(资料分群)

1.分群方法-阶层式分群

2.分群方法- Kmeans分群

3.分群方法- DBScan分群

4.分群结果评估

5.实战范例 - 利用分群找出文章主题

 

第十一章:使用机器学习建立数据模型(特征筛选与降低维度)

1.特征筛选(Feature Selection)

2.特征萃取-PCA

3.特征萃取-SVD

4.实战范例 - 使用SVD 压缩图档

 

第十二章:使用机器学习建立数据模型(关联与频繁样式分析篇)

1.关联分析(Association Rule)

2.频繁样式探勘(Frequent Pattern Mining)

3.实战范例 - 购物篮分析实例

 
立 即 下 载

相关资源

发表评论

点 击 提 交