2017最新唐宇迪 Python数据分析与机器学习实战视频教程
【课程介绍】
课程风格通俗易懂,真实案例实战。精心挑选真实的数据集为案例,通过python数据科学库numpy,pandas,matplot结合机器学习库scikit-learn完成一些列的机器学习案例。课程以实战为基础,所有课时都结合代码演示如何使用这些python库来完成一个真实的数据案例。算法与项目相结合,选择经典kaggle项目,从数据预处理开始一步步代码实战带大家快速入门机器学习。
【课程目标】
课程目标:零基础快速掌握python数据分析与机器学习算法实战,快速入门python最流行的数据分析库numpy,pandas,matplotlib。对于繁琐的机器学习算法,先从原理上进行推导,以算法流程为主结合实际案例完成算法代码,使用scikit-learn机器学习库完成快速建立模型,评估以及预测。结合经典kaggle案例,从数据预处理开始一步步完成整个项目,使大家对如何应用python库完成实际的项目有完整的经验与概念。【课程目录】
章节1: Python科学计算库-Numpy4
课时1课程介绍(主题与大纲)
课时2机器学习概述
课时3使用Anaconda安装python环境(Python新手先看这个)
课时4课程数据,代码,PPT(在参考资料界面)
课时5科学计算库Numpy
课时6Numpy基础结构
课时7Numpy矩阵基础
课时8Numpy常用函数
课时9矩阵常用操作
课时10不同复制操作对比章节2: python数据分析处理库-Pandas
课时11Pandas数据读取
课时12Pandas索引与计算
课时13Pandas数据预处理实例
课时14Pandas常用预处理方法
课时15Pandas自定义函数
课时16Series结构章节3: Python数据可视化库-Matplotlib
课时17折线图绘制
课时18子图操作
课时19条形图与散点图
课时20柱形图与盒图
课时21细节设置章节4: Python可视化库Seaborn6
课时22Seaborn简介
课时23整体布局风格设置
课时24风格细节设置
课时25调色板
课时26调色板颜色设置
课时27单变量分析绘图
课时28回归分析绘图
课时29多变量分析绘图
课时30分类属性绘图
课时31Facetgrid使用方法
课时32Facetgrid绘制多变量
课时33热度图绘制章节5: 回归算法
课时34回归算法综述
课时35回归误差原理推导
课时36回归算法如何得出最优解
课时37基于公式推导完成简易线性回归
课时38逻辑回归与梯度下降
课时39使用梯度下降求解回归问题章节6: 决策树
课时40决策树算法综述
课时41决策树熵原理
课时42决策树构造实例
课时43信息增益原理
课时44信息增益率的作用
课时45决策树剪枝策略
课时46随机森林模型
课时47决策树参数详解章节7: 贝叶斯算法
课时48贝叶斯算法概述
课时49贝叶斯推导实例
课时50贝叶斯拼写纠错实例
课时51垃圾邮件过滤实例
课时52贝叶斯实现拼写检查器章节8: 支持向量机
课时53支持向量机要解决的问题
课时54支持向量机目标函数
课时55支持向量机目标函数求解
课时56支持向量机求解实例
课时57支持向量机软间隔问题
课时58支持向量核变换
课时59SMO算法求解支持向量机章节9: 神经网络
课时60初识神经网络
课时61计算机视觉所面临的挑战
课时62K近邻尝试图像分类
课时63超参数的作用
课时64线性分类原理
课时65神经网络-损失函数
课时66神经网络-正则化惩罚项
课时67神经网络-softmax分类器
课时68神经网络-最优化形象解读
课时69神经网络-梯度下降细节问题
课时70神经网络-反向传播
课时71神经网络架构
课时72神经网络实例演示
课时73神经网络过拟合解决方案
课时74感受神经网络的强大章节10: Xgboost集成算法
课时75集成算法思想
课时76xgboost基本原理
课时77xgboost目标函数推导
课时78xgboost求解实例
课时79xgboost安装
课时80xgboost实战演示
课时81Adaboost算法概述章节11: 自然语言处理词向量模型-Word2Vec
课时82自然语言处理与深度学习
课时83语言模型
课时84-N-gram模型
课时85词向量
课时86神经网络模型
课时87Hierarchical Softmax
课时88CBOW模型实例
课时89CBOW求解目标
课时90梯度上升求解
课时91负采样模型章节12: K近邻与聚类
课时92无监督聚类问题
课时93聚类结果与离群点分析
课时94K-means聚类案例对NBA球员进行评估
课时95使用Kmeans进行图像压缩
课时96K近邻算法原理
课时97K近邻算法代码实现章节13: PCA降维与SVD矩阵分解
课时98PCA基本原理
课时99PCA实例
课时100SVD奇异值分解原理
课时101SVD推荐系统应用实例章节14: scikit-learn模型建立与评估
课时102使用python库分析汽车油耗效率
课时103使用scikit-learn库建立回归模型
课时104使用逻辑回归改进模型效果
课时105 模型效果衡量标准
课时106ROC指标与测试集的价值
课时107交叉验证
课时108多类别问题章节15: Python库分析科比生涯数据
课时109Kobe Bryan生涯数据读取与简介
课时110特征数据可视化展示
课时111数据预处理
课时112使用Scikit-learn建立模型章节16: 机器学习项目实战-泰坦尼克获救预测
课时113船员数据分析
课时114数据预处理
课时115使用回归算法进行预测
课时117随机森林特征重要性分析章节17: 机器学习项目实战-交易数据异常检测
课时118案例背景和目标
课时119样本不均衡解决方案
课时120下采样策略
课时121交叉验证
课时122模型评估方法
课时123正则化惩罚
课时124逻辑回归模型
课时125混淆矩阵
课时126逻辑回归阈值对结果的影响
课时127SMOTE样本生成策略章节18: Python文本数据分析:新闻分类任务
课时128文本分析与关键词提取
课时129相似度计算
课时130新闻数据与任务简介
课时131TF-IDF关键词提取
课时132LDA建模
课时133基于贝叶斯算法进行新闻分类章节19: Python时间序列分析
课时134章节简介
课时135Pandas生成时间序列
课时136Pandas数据重采样
课时137Pandas滑动窗口
课时138数据平稳性与差分法
课时139ARIMA模型
课时140相关函数评估方法
课时141建立ARIMA模型
课时142参数选择
课时143股票预测案例
课时144使用tsfresh库进行分类任务
课时145维基百科词条EDA章节20: 使用Gensim库构造中文维基百度数据词向量模型
课时146使用Gensim库构造词向量
课时147维基百科中文数据处理
课时148Gensim构造word2vec模型
课时149测试模型相似度结果章节21: 机器学习项目实战-贷款申请最大化利润
课时151数据预处理
课时152获得最大利润的条件与做法
课时153预测结果并解决样本不均衡问题章节22: 机器学习项目实战-用户流失预警
课时154数据背景介绍
课时155数据预处理
课时156尝试多种分类器效果
课时157结果衡量指标的意义
课时158应用阈值得出结果章节23: 探索性数据分析-足球赛事数据集
课时159内容简介
课时160数据背景介绍
课时161数据读取与预处理
课时162数据切分模块
课时163缺失值可视化分析
课时164特征可视化展示
课时165多特征之间关系分析
课时166报表可视化分析
课时167红牌和肤色的关系章节24: 探索性数据分析-农粮组织数据集
课时168数据背景简介
课时169数据切片分析
课时170单变量分析
课时171峰度与偏度
课时172数据对数变换
课时173数据分析维度
课时174变量关系可视化展示章节25: 机器学习项目实战-HTTP日志聚类分析!
课时175建立特征工程
课时176特征数据预处理
课时177应用聚类算法得出异常IP点
相关资源