课程目标 
l 掌握数据分析的流程
l 掌握python数据分析核心库的使用,如numpy、pandas、matplotlib
l 了解常用数据分析(挖掘)算法的原理,熟悉机器学习的各个环节,并能利用相应的算法建模
l 熟练使用sk-learn进行数据挖掘
课程大纲 
|
章节
|
主要授课内容
|
|
| |
第1章 Python数据分析概述
|
1.数据分析的概念、流程、应用场景
2.数据分析常用的工具、python数据分析的优势、常用类库的介绍
3.Jupyter Notebook的安装及使用
|
| |
第2章 Numpy数值计算基础
|
1.ndarray的创建、访问、常用属性
2.矩阵的创建
3.通用函数ufunc
4.广播机制
5.数学知识
6.简单统计分析,读写文件、排序、去重、常用统计函数
|
|
第3章 Pandas统计分析基础
|
1.Series常用操作
2.DataFrame常用操作
3.读写不同数据源
4.数据过滤与转换
5.时间序列操作
6.分组与聚合
7.透视与交叉表
|
|
|
第4章 利用pandas进行数据预处理
|
1.合并数据,堆叠合并、主键合并、重叠合并
2.清洗数据,处理重复值、缺失值、异常值的处理
3.标准化数据,离差标准化、标准差标准化、小数定标标准化
4.转化数据 ,类别型特征处理为哑变量,连续性特征离散化处理
|
|
|
第5章 数据可视化
|
1.数据可视化概述
2.常用图表,如柱状图、饼状图、直方图、箱线图等的介绍
3.matplotlib绘图基础,如基础语法、rc参数、标签刻度、子图等
4.matplotlib绘图实战
5.pandas绘图实战
|
|
|
第6章 机器学习与挖掘建模
|
1.机器学习概述
2.机器学习分类
3.机器学习流程
4.机器学习评估
5.经典机器学习算法原理剖析,如 knn、kmeans、朴素贝叶斯、决策树、线性回归、逻辑回归、支持向量机、关系分析等
6.关联规则算法
7.时序模式
8.物体推荐算法
9.使用sk-learn建模,包括数据集划分、数据预处理、模型训练、模型评估等
|
|
|
第7章 数据分析与挖掘实战案例
|
|
|
如果您想学习本课程,请
预约报名
如果没找到合适的课程或有特殊培训需求,请
订制培训
除培训外,同时提供相关技术咨询与技术支持服务,有需求请发需求表到邮箱soft@info-soft.cn,或致电4007991916
技术服务需求表下载请点击
服务优势:
丰富专家资源,精准匹配相关行业,相关项目技术精英,面向用户实际需求,针对性培训或咨询,互动式交流,案例教学,精品小班,实际工程项目经验分享,快捷高效,节省时间与金钱,少走弯路与错路。
专家力量:
中国科学院相关研究所高级研究人员
西门子,TI,vmware,MSC,Ansys,MDI,Mentor, candence,Altium,Atmel 、Freescale,达索,华为等
大型公司高级工程师,项目经理,技术支持专家
中科信软培训中心,资深专家或讲师
大多名牌大学,硕士以上学历,相关学历背景专业,理论素养高
多年实际项目实践,大型复杂项目实战案例分享,热情,乐于技术分享
针对客户实际需要,真实案例演示,互动式沟通,学有所值