适用人群
从事机器学习,数据分析,数据挖掘的同学们以及python使用者
课程概述
选择经典案例基于真实数据集,从数据预处理开始到建立机器学习模型以及效果评估,完整的讲解如何使用python及其常用库进行数据的分析和模型的建立。对于每一个面对的挑战,分析解决问题思路以及如何构造合适的模型并且给出合适评估方法。在每一个案例中,同学们可以快速掌握如何使用pandas进行数据的预处理和分析,使用matplotlib进行可视化的展示以及基于scikit-learn库的机器学习模型的建立
【课程内容】
课时01.课程简介
课时02.课程数据,代码下载
课时03.使用Anaconda搭建python环境
课时04.Kobe.Bryan生涯数据读取与简介
课时05.特征数据可视化展示
课时06.数据预处理
课时07.使用scikit-learn建立分类模型
课时08.数据简介及面临的挑战
课时09.数据不平衡问题解决方案
课时10.逻辑回归进行分类预测
课时11.使用阈值来衡量预测标准
课时12.使用数据生成策略
课时13.数据简介与特征课时化展示
课时14.不同特征的分布规则
课时15.决策树模型参数详解
课时16.决策树中参数的选择
课时17.将建立好决策树可视化展示出来
课时18.船员数据分析
课时19.数据预处理
课时20.使用回归算法进行预测
课时21.使用随机森林改进模型
课时22.随机森林特征重要性分析
课时23.级联模型原理
课时24.数据预处理与热度图
课时25.二阶段输入特征制作
课时26.使用级联模型进行预测
课时27.数据简介与特征预处理
课时28.员工不同属性指标对结果的影响
课时29.数据预处理
课时30.构建预测模型
课时31.基于聚类模型的分析
课时32.tensorflow框架的安装
课时33.神经网络模型概述
课时34.使用tensorflow设定基本参数
课时35.卷积神经网络模型
课时36.构建完整的神经网络模型
课时37.训练神经网络模型
课时38.PCA原理简介
课时39.数据预处理
课时40.协方差分析
课时41.使用PCA进行降维
课时42.数据简介与故事背景
课时43.基于词频的特征提取
课时44.改进特征选择方法
课时45.数据清洗
课时46.数据预处理
课时47.盈利方法和模型评估
课时48.预测结果
相关资源