本书从解决工作中的实际问题出发,以漫画形式讲解数据分析知识,并提炼、总结工作中常用的Python 数据处理、数据分析实战方法与技巧。本书力求通俗易懂地介绍相关知识,在不影响学习、理解效果的前提下,尽可能地避免使用晦涩难懂的Python 编程、统计术语或模型公式,如需了解相关的知识,可查阅相关的图书或资料。本书定位是带领Python 数据分析初学者入门,并能在学习和工作中解决大部分问题,或满足大部分需求。入门后,读者如需进一步学习进阶技能,可自行扩展阅读相关图书或资料。学习是永无止境的,正所谓“师傅领进门,修行在个人”。
张文霖,新浪博客“小蚊子数据分析”博主,“谁说菜鸟不会数据分析“系列图书作者,具有多年移动互联网数据分析经验,略懂Excel、PPT、SPSS、Python、SQL等工具。
第1 章 数据分析概况
1.1 数据分析定义
1.2 数据分析作用
1.3 数据分析步骤
1.3.1 明确分析目的和思路
1.3.2 数据收集
1.3.3 数据处理
1.3.4 分析数据
1.3.5 数据展现
1.3.6 报告撰写
1.4 常用的数据分析工具
第2 章 Python 概况
2.1 Anaconda 安装与使用
2.1.1 Anaconda 简介
2.1.2 安装Anaconda
2.1.3 使用Spyder
2.2 变量
2.2.1 变量定义
2.2.2 变量赋值
2.2.3 变量命名
2.3 数据类型
2.3.1 数值型
2.3.2 字符型
2.3.3 逻辑型
2.4 数据结构
2.4.1 列表
2.4.2 元组
2.4.3 字典
2.4.4 序列
2.4.5 数据框
2.5 函数
2.5.1 函数简介
2.5.2 Python 内置函数
2.5.3 使用函数
2.6 模块
2.6.1 模块简介
2.6.2 Python 标准模块
2.6.3 使用模块
2.7 Python 编程注意事项
第3 章 数据处理
3.1 数据导入导出
3.1.1 数据导入
3.1.2 数据访问
3.1.3 数据导出
3.2 数据清洗
3.2.1 数据排序
3.2.2 重复数据处理
3.2.3 空格数据处理
3.3 数据转换
3.3.1 数据类型查看
3.3.2 数值转字符
3.3.3 字符转数值
3.3.4 字符转时间
3.3.5 时间转字符
3.4 数据抽取
3.4.1 字段拆分
3.4.2 记录抽取
3.5 数据合并
3.5.1 记录合并
3.5.2 字段合并
3.5.3 字段匹配
3.6 数据计算
3.6.1 简单计算
3.6.2 时间计算
3.6.3 数据分组
第4 章 数据分析
4.1 对比分析
4.2 描述性分析
4.3 分组分析
4.4 结构分析
4.5 分布分析
4.6 交叉分析
4.7 矩阵分析
4.8 转化分析
4.9 RFM 分析
4.10 留存分析
4.11 生命周期价值分析
4.12 简单线性回归
第5 章 数据可视化
5.1 数据可视化简介
5.1.1 什么是数据可视化
5.1.2 数据可视化常用图表
5.1.3 通过关系选择图表
5.1.4 Python 可视化模块
5.2 matplotlib 入门
5.3 饼图
5.4 柱形图
5.5 条形图
5.6 折线图
5.7 面积图
5.8 散点图
5.9 矩阵图