从零开始学Python数据分析与挖掘第二版pdf下载电子版|百度网盘下载

编辑评论:

Learn Python Data Analysis and Mining 2nd Edition from Scratch 使用 Python 3.7 版本作为数据分析和挖掘的应用工具,从 Python 的基本语法入手,介绍数值计算相关的 numpy . ,用于数据处理的pandas,用于数据可视化的matplotlib,用于数据挖掘的sklearn等。

从零开始学习Python数据分析与挖掘第二版pdf下载

编辑推荐

《为满足用人单位对数据分析和挖掘人员编程的技能要求,本书遵循由浅入深的原则,详细介绍了使用Python及其相关工具的实用技巧实现数据分析和挖掘,Python中成熟的Numpy、Pandas、MatPlotLib、Sklearn、Seaborn、Statsmodels和SciPy模块实现了数据分析和挖掘中的数据清洗、排序、探索、可视化、建模和评估等操作。分析挖掘或感兴趣的读者可以从中学习到所需。十种常用的数据挖掘算法和实际案例的详细讲解,如多元线性等。

简介

本书涵盖了15种可视化图形和10个常用的数据挖掘算法和实际项目。通过本书的学习,读者可以掌握数据分析与挖掘的理论知识和实践技能。本书适用于统计学、数学、经济学、金融学、管理学及相关理工科专业的本科生和研究生,也可以提高从事数据咨询、研究或分析的人员的专业水平和技能。

关于作者

刘顺祥,统计学硕士,“数据分析1480”公众号运营者。曾在唯品会电商平台担任数据分析师。目前就职于领先的数据咨询公司,为联想、亨氏、美丽田园、喜力、网鱼网咖等企业提供数据咨询服务。 《从零开始学习 Python 数据分析与挖掘》一书的作者。

目录

第一章数据分析与挖掘概述

1.1 什么是数据分析与挖掘

1.2 数据分析与挖掘的应用领域

1.2.1 电商领域——发现打破规则的“害群之马”

1.2.2 交通领域-出租车平台私人定制

1.2.3 医疗健康领域——寻找最佳医疗解决方案

1.3 数据分析与挖掘的区别

1.4 数据挖掘的过程

1.4.1 明确目标

1.4.2 数据收集

1.4.3 数据清洗

1.4.4 构建模型

1.4.5 模型评估

1.4.6 应用部署

1.5 常用的数据分析和挖掘工具

1.6 章节总结

1.7 课后练习

第 2 章从收入预测分析开始

2.1 下载安装Anaconda

2.1.1 Windows系统安装

2.1.2 基于Mac系统安装

2.1.3 基于Linux系统安装

2.2 基于Python的案例实战

2.2.1 数据预处理

2.2.2 数据探索性分析

2.2.3 数据建模

2.3 章节总结

2.4 课后练习

第 3 章 Python 基础和数据捕获

3.1 数据结构和方法

3.1.1 列表

3.1.2 元组

3.1.3 字典

3.2 控制流程

3.2.1 if 分支

3.2.2 for 循环

3.2.3 while循环

3.3 字符串处理方法

3.3.1 字符串的常用方法

3.3.2 正则表达式

3.4 自定义函数

3.4.1 自定义函数语法

3.4.2 自定义函数的几个参数

3.5 一个爬虫案例

3.6 章节总结

3.7 课后练习

第 4 章 Python 数值计算 - Numpy 的高效技能

4.1 数组创建和操作

4.1.1 数组创建

4.1.2 数组元素的获取

4.1.3 数组的常用属性

4.1.4 阵列形状处理

4.2 数组的基本运算符

4.2.1 四种算术运算

4.2.2 比较操作

4.2.3 广播操作

4.3 常用的数学和统计函数

4.4 线性代数相关计算

4.4.1 矩阵乘法

4.4.2 诊断功能的使用

4.4.3 特征根和特征向量

4.4.4 多元线性回归模型的求解

4.4.5 求解多元线性方程

4.4.6 范数的计算

4.5 伪随机数的生成

4.6 章节总结

4.7 课后练习

第 5 章 Python 数据处理 - 展示 Pandas 的力量 /> 5.1 序列和数据框构建

5.1.1 构造序列

5.1.2 构造数据框

5.2 读取外部数据

5.2.1 文本文件读取

5.2.2 电子表格阅读

5.2.3 读取数据库数据

5.3 数据类型转换和描述性统计

5.4 字符和日期数据的处理

5.5 常用数据清洗方法

5.5.1 反复观察处理

5.5.2 缺失值处理

5.5.3 异常值处理

5.6 数据子集的获取

5.7 数据透视表函数

5.8 表之间的合并和连接

5.9 分组和聚合操作

5.10 章节总结

5.11 课后练习

第 6 章 Python 数据可视化 - 分析报告的必要元素

6.1 离散变量的可视化

6.1.1 饼图-“芝麻信用”失信用户分布

6.1.2 条形图-胡润排行榜

6.2 数值变量的可视化

6.2.1 直方图和核密度曲线——显示年龄分布特征

6.2.2 Box-and-plot-房屋单价分布规律

6.2.3 小提琴图——客户消费数据的呈现

6.2.4 折线图-公众号每日阅读趋势

6.3 关系数据的可视化

6.3.1 散点图——探究鸢尾花瓣长宽的关系

6.3.2 气泡图 - 暴露产品的销售特征

6.3.3 热图 - 简单的月历

6.4 组合多个图形

6.5 章节总结

6.6 课后练习

第7章线性回归预测模型

7.1 单变量线性回归模型 - 收入预测

7.2 多元线性回归模型 - 销售利润预测

7.2.1 回归模型的参数求解

7.2.2 回归模型的预测

7.3 回归模型的假设检验

7.3.1 模型显着性检验——F检验

7.3.2 回归系数的显着性检验-t检验

7.4 回归模型的诊断

7.4.1 正态性检验

7.4.2 多重共线性检验

7.4.3 线性相关检验

7.4.4 异常值检验

7.4.5 独立性测试

7.4.6 方差齐性检验

7.5 章节总结

7.6 课后练习

第 8 章岭回归和 LASSO 回归模型

8.1 岭回归模型

8.1.1 参数求解

8.1.2 系数解的几何意义

8.2 岭回归模型的应用——糖尿病状况的预测(一)

8.2.1 确定λ值的目测方法

8.2.2 确定λ值的交叉验证方法

8.2.3 模型预测

8.3 LASSO回归模型-糖尿病疾病预测(二)

8.3.1 参数求解

8.3.2 系数解的几何意义

8.4 LASSO回归模型的应用

8.4.1 确定λ值的视觉方法

8.4.2 确定λ值的交叉验证方法

8.4.3 模型预测

8.5 章节总结

8.6 课后练习

第9章逻辑回归分类模型

9.1 Logistic模型的构建

9.1.1 逻辑模型参数求解

9.1.2 逻辑模型参数解释

9.2 分类模型的评价方法

9.2.1 混淆矩阵

9.2.2 ROC曲线

9.2.3 K-S曲线

9.3 逻辑回归模型的应用——运动状态的识别

……

阅读剩余
THE END