网络中的信息是很庞大的。如何提取这些信息?如何分析这些信息?这都需要用到数据分析技术。而数据分析技术的*语言是Python,而本书便是一本适合小白学习Python数据分析的入门图书,书中不仅有各种分析框架的使用技巧,而且也有各类数据图表的绘制方法。本书通过讲解多个案例,让读者体验数据背后的乐趣。
本书共11章,核心内容包括Python数据分析环境安装、NumPy基础、pandas基础、外部数据读取与存储、数据清洗与整理、数据分组与聚合、matplotlib可视化、seaborn可视化、pyecharts可视化、时间序列、网站日志分析综合案例等。
本书适合Python数据分析的初学者和爱好者阅读,也适合作为各类院校相关专业的教学用书,同时还适合相关社会培训机构作为Python数据分析的培训教材或者参考书。
互联网的飞速发展伴随着海量信息的产生,而海量信息的背后对应的则是海量数据。如何从这些海量数据中获取有价值的信息来供人们学习和工作使用,这就不得不用到大数据挖掘和分析技术。数据分析作为大数据技术的核心一环,其重要性不言而喻。
在数据分析领域,Python语言以其简单易用,并提供了优秀、好用的第三方库和数据分析的完整框架而深受数据分析人员的青睐。可以说,Python已经当仁不让地成为了数据分析人员的一把利器。程序员想要进入数据分析行业,首先要掌握Python数据分析技术,只有这样才能在严峻的就业市场中具有较强的竞争力。
目前图书市场上关于Python数据分析的图书主要是几本翻译图书,其定位相对高端,而且翻译质量参差不齐,案例数据不方便下载,阅读难度系数较大,初学者不容易上手,故不适合初学者学习;而国内的几本原创Python数据分析图书质量也良莠不齐,不成系统,也不适合初学者阅读。可以说,图书市场上还鲜见一本通俗易懂且适合小白阅读的Python数据分析入门图书,基于此,笔者编写了本书。本书从Python数据分析的基础知识入手讲解,然后结合大量的数据分析案例,系统地介绍了Python数据分析的方法和流程,手把手带领读者掌握Python数据分析的相关知识,并提高读者的项目实践能力。
本书特色
1.视频教学,高效、直观
为了便于读者高效、直观地学习,笔者专门为本书的重点内容录制了配套教学视频,读者可以一边看书,一边结合教学视频进行学习,以取得更好的学习效果。
2.内容全面,讲解系统
本书不但全面介绍了从Numpy到pandas,从matplotlib到pyecharts的数据分析必学技术,而且还系统地讲解了从数据读取到数据清洗,从数据处理到数据可视化的详细步骤。
3.给出了数据分析环境的安装和配置步骤
本书详细介绍了Python数据分析集成环境Anaconda的安装步骤和使用方法,可以大大降低初学者学习Python数据分析的门槛,从而让读者快速跨进Python数据分析的大门。
4.详细介绍了数据分析的流程
本书从一开始便对数据分析的流程进行了详细介绍,而且在讲解中结合了多个实用性很强的数据分析项目案例,带领读者掌握Python数据分析的相关知识,以解决实际工作中的数据分析问题。
5.提供了9个有较高应用价值的项目案例,有很强的实用性
本书提供了9个实用性很强的数据分析项目案例,这些案例从不同的分析角度切入进行讲解,具有较高的应用价值。读者通过实际操练,可以更加透彻地理解数据分析的相关知识。
6.提供教学PPT,方便教学和学习
笔者专门为本书制作了专业的教学PPT,以方便相关院校的教学人员授课时使用;读者也可以通过教学PPT,提纲挈领地掌握书中的内容脉络。
本书内容
第1章 Python环境搭建与使用
本章介绍了如何搭建和使用Python数据分析环境,并介绍了如何使用Jupyter Notebook进行数据分析编程。
第2章 NumPy入门和实战
本章首先介绍了Numpy的基本数据结构多维数组;然后介绍了多维数组的创建和基本属性、数组的切片和索引方法,以及数组的运算与存取;最后通过综合案例,演示了如何实现图像的变换功能。
第3章 pandas入门和实战
本章首先介绍了pandas中两种基础数据结构的创建和使用方法;然后详细讲解了DataFrame的选取和操作,同时介绍了其算术运算、函数的使用和pandas的可视化方法;最后结合案例,介绍了数据分析流程。
第4章 外部数据的读取与存储
本章主要介绍了如何利用pandas库读取外部数据为DataFrame数据格式,并介绍了通过Python进行数据处理后如何将DataFrame类数据存储到相应的外部数据文件中。
第5章 数据清洗与整理
本章主要介绍了如何使用pandas进行多源数据的清洗和整理,并给出了针对多源数据的合并和连接方法,以及数据的重塑方法,最后通过一个综合案例演示了数据分析中的数据清洗过程。
第6章 数据分组与聚合
本章涵盖的主要内容有:GroupBy的原理和使用方法;聚合函数的使用;分组运算中transform和apply方法的使用;通过pandas创建数据透视表;通过综合案例,巩固数据分组统计的使用。
第7章 matplotlib可视化
本章涵盖的主要内容有:利用matplotlib进行图表绘制;学会使用自定义设置,个性化绘制图表;通过综合案例,巩固matplotlib可视化的方法和技巧。
第8章 seaborn可视化
本章涵盖的主要内容有:使用seaborn绘图;学会seaborn样式和分布图绘制;通过综合案例泰坦尼克号的生还者数据,巩固seaborn的可视化方法和技巧。
第9章 pyecharts可视化
本章涵盖的主要内容有:安装pyecharts库;学会使用pyecharts库绘制基本图表;学会绘制其他图表;通过综合案例,巩固pyecharts的绘制方法和技巧。
第10章 时间序列
本章涵盖的主要内容有:时间序列的构造和使用方法;时间序列的频率转换与重采样;通过综合案例,巩固时间序列数据的处理与分析方法。
第11章 综合案例网站日志分析
本章通过一个综合案例,介绍了如何通过Python的第三方库解析网站日志;如何利用pandas对网站日志数据进行预处理;结合前面介绍的数据分析和数据可视化技术对网站日志数据进行分析。
本书配套资源获取方式
本书提供以下配套资源:
? 本书配套教学视频;
? 超值电子书(地图绘制技术);
? 本书相关素材文件;
? 本书源代码文件;
? 本书教学PPT。
这些配套资源需要读者自行下载。请登录机械工业出版社华章公司网站,在该网站上搜索到本书,然后单击资料下载按钮即可找到配书资源下载链接。
适合阅读本书的读者
? 数据分析初学者;
? 数据分析爱好者;
? 数据分析从业人员;
? 数据分析培训学员;
? 高校相关专业的学生。
本书由罗攀主笔编写,蒋仟、陈瑞滕和潘丹三位小伙伴也参与了部分章节的编写工作,在此对他们表示特别的感谢!