人人都爱数据科学
课程特色:
明星讲师。诸多免费课程热力遍布全网,五星口碑爆棚;
规划全面。涵盖基础知识、爬虫采集、数据处理、可视化、数据建模,难得一见的Python体系全面数据科学课程,起步之路有高度;
精品质量。课程设计环节紧凑,循循善诱;课堂教学如行云流水,让人受益匪浅;
讲师介绍:
丘祐玮(David Chiu) – 大数软件(LargitData)创办人,是一位致力于提供舆情分析服务的创业者与数据科学家,熟悉Hadoop,Spark 等大数据平台,及擅长使用R,Python与机器学习技术进行数据分析。曾任多家上市公司顾问及担任知名大数据应用程序竞赛的评审,已编著MachineLearning With R Cookbook [Packt] 与 R Cookbook [Packt] 二书。
课程大纲:
第一章:Python与数据科学应用
1.数据科学简介与应用
2.Python与数据科学
3.安装Anaconda
4.使用Jupyter Notebook
5.Python 3语法快速简介
6、Python 資料分析套件 - Pandas 簡介
7.数据科学步骤详解
8.实战范例 - 使用Python计算文章中的字词频率
第二章:数据搜集实例
1.数据型态
2.结构化vs半结构化vs非结构化资料
3.Python IO与档案处理
4.处理CSV, Excel格式资料
5.处理JSON, XML格式资料
6.撰写网路爬虫搜集网路资料
7.实战范例 - 房天下(Fang.com)屋价资料搜集
第三章:资料清理(I)
1.资料清理概论
2.简介Pandas -使用Pandas处理资料
3.资料筛选
4.侦测遗失值
5.补齐遗失值
6.实战范例 - 房屋资料处理
第四章:资料清理(II)
1.资料转换
2.处理时间格式资料
3.重塑资料
4.学习正规表达式
5.实战范例 - 新闻资料处理
第五章:资料探索与资料视觉化
1.使用Pandas产生叙述性统计
2.如何使用Pandas绘制统计图表
3.实战范例 - 网页浏览纪录资料分析
第六章:资料储存实例
1.关联式资料库- SQLite简介
2.将资料储存至资料库中
3.使用SQL Query分析结构化资料
4.实战范例 - 汇率资讯储存与管理
第七章:使用机器学习建立数据模型(回归模型)
1.机器学习基础
2.Scikit-Learn套件简介
3.监督式学习与非监督式学习
4.回归分析
5.回归模型评估
6.实战范例 - 使用回归模型分析房屋价格
第八章:使用机器学习建立数据模型(分类模型)
1.资料分类-决策树
2.资料分类- Logistic Regression
3.资料分类- SVM
4.资料分类-类神经网路
5.资料分类-随机森林
6.实战范例 - 使用分类模型预测客户流失
第九章:使用机器学习建立数据模型(验证模型)
1.混淆矩阵(Confusion Matrix )与其意义
2.交叉验证(Cross Validation)
3.使用ROC评估不同分类模型
4.实战范例 - 评估不同客户流失分析模型
第十章:使用机器学习建立数据模型(资料分群)
1.分群方法-阶层式分群
2.分群方法- Kmeans分群
3.分群方法- DBScan分群
4.分群结果评估
5.实战范例 - 利用分群找出文章主题
第十一章:使用机器学习建立数据模型(特征筛选与降低维度)
1.特征筛选(Feature Selection)
2.特征萃取-PCA
3.特征萃取-SVD
4.实战范例 - 使用SVD 压缩图档
第十二章:使用机器学习建立数据模型(关联与频繁样式分析篇)
1.关联分析(Association Rule)
2.频繁样式探勘(Frequent Pattern Mining)
3.实战范例 - 购物篮分析实例
相关资源