关于我们
书单推荐
新书推荐
|
数据分析与数据思维——Python编程要点、分析方法与实践技能 读者对象:高等学校数据科学与大数据、计算机等专业学生,以及大数据管理与技术、信息管理、商科类部分专业的学生
本书面向零基础的Python学习者和数据分析师,较为详尽的文字叙述与足够的图片解释相结合,篇幅内容合适,没有包含对初学者学习难度过高的知识,提供了丰富的教学资源(包括系统、学习指南、疑难解答等),同时专业解读数据分析师应掌握的编程要点、分析方法和实践技能,实用性强,学习效果好。本书主要内容包括6个模块:Python语言与数据分析、Python语言基础语法、Python语言高级语法、数据准备与加工、数据分析算法与模型、自然语言处理与图像处理。本书可以作为高等院校数据科学与大数据、计算机科学与技术、软件工程等工科类各专业学生的相关课程的教材,也可以作为新文科特色的大数据管理、统计学、金融学、信息管理、电子商务、商务智能、金融科技等相关专业相关课程的教材。
朝乐门,男,1979年生,中国人民大学信息资源管理学院、数据工程与知识工程教育部重点实验室副教授,博士生导师。中国计算机学会信息系统专委员会委员、ACM高级会员、国际知识管理协会正式委员、全国高校大数据教育联盟大数据教材专家指导委员会委员、清华大学博士后校友会IT分会副秘书长;主持完成国家自然科学基金、国家社会科学基金等重要科学研究项目10余项;参与完成核高基、973、863、国家自然科学基金重点项目、国家社会科学基金重大项目等国家重大科研项目10余项;发表SCI/SSCI/EI/CSCI论文30余篇,软件著作权5个、发明专利3项、出版学术专著3部;获得北京市中青年骨干教师称号、国际知识管理与智力资本杰出成就奖、IBM全球卓越教师奖、Emerald/EFMD国际杰出博士论文奖、国家自然科学基金项目优秀项目、中国大数据学术创新奖、中国大数据创新百人榜单、全国大数据教育行业杰出贡献奖等多种奖励30余项。
第1章 Python语言与数据分析
学习指南 ........1 1.1 Python语言及其特征 .................................................................................................. 2 1.1.1 Python语言的特点 .......................................................................................... 2 1.1.2 Python语言的版本 .......................................................................................... 3 1.2 数据分析与Python语言 ............................................................................................. 4 1.2.1 Python语言在数据分析领域的重要地位 ....................................................... 6 1.2.2 Python语言程序代码的编写质量 ................................................................... 7 1.3 面向数据分析的Python编程 ...................................................................................... 7 1.3.1 Python语言的基础语法 .................................................................................. 7 1.3.2 Python的第三方工具包 .................................................................................. 8 1.3.3 Python学习或编程中常见误区 ....................................................................... 8 1.4 Python数据分析的集成开发环境 ............................................................................... 9 1.5 Python代码的编写与运行实例 ................................................................................... 10 小结 ....... 12 习题1.................................................................................................................. 13 第2章 Python语言基础语法 学习指南............................................................................................................... 15 2.1 变量及其定义方法 .............................................................................................. 16 2.1.1 变量的定义方法 .............................................................................................. 17 2.1.2 Python是动态类型语言 .................................................................................. 17 2.1.3 Python是强类型语言 ...................................................................................... 18 2.1.4 Python中的变量是引用类变量 ....................................................................... 19 2.1.5 Python中区分大小写 ...................................................................................... 19 2.1.6 变量命名规范 .................................................................................................. 19 2.1.7 iPython的特殊变量 ......................................................................................... 21 2.1.8 查看Python关键字的方法 ............................................................................. 21 2.1.9 查看已定义的所有变量 ................................................................................... 22 2.1.10 删除变量 ........................................................................................................ 23 2.2 运算符、表达式、语句 ............................................................................................... 23 2.2.1 运算符 .................................................................................................. 23 2.2.2 语句书写规范 .................................................................................................. 30 2.2.3 赋值语句 .......................................................................................................... 33 2.2.4 注释语句 .......................................................................................................... 35 2.2.5 if语句 ..................................................................................................... 36 2.2.6 for语句 .................................................................................................... 39 2.2.7 while语句 ........................................................................................................ 42 2.2.8 pass语句 .......................................................................................................... 44 2.3 数据类型与数据结构 ........................................................................................ 45 2.3.1 数据类型 .......................................................................................................... 45 2.3.2 列表.......................................................................................................... 51 2.3.3 元组.................................................................................................... 61 2.3.4 字符串................................................................................................... 67 2.3.5 序列.................................................................................................... 72 2.3.6 集合.................................................................................................... 76 2.3.7 字典.................................................................................................... 80 2.4 包与模块 ......................................................................................................... 82 2.4.1 包 .......................................................................................................... 82 2.4.2 模块 ..................................................................................................... 86 2.5 内置函数、模块函数和自定义函数 ........................................................................... 88 2.5.1 函数 ................................................................................................. 88 2.5.2 内置函数 .......................................................................................................... 90 2.5.3 模块函数 .......................................................................................................... 93 2.5.4 自定义函数 ..................................................................................... 95 小结 .................................................................................................................. 104 习题2 .............................................................................................................. 104 第3章 Python语言高级语法 学习指南 ........................................................................................................ 109 3.1 迭代器与可迭代对象 ................................................................................................... 109 3.1.1 可迭代对象 ................................................................................. 111 3.1.2 迭代器 .................................................................................................. 111 3.2 生成器与装饰器 .......................................................................................................... 112 3.2.1 生成器 .............................................................................................................. 112 3.2.2 装饰器 .............................................................................................................. 113 3.3 查阅帮助 ...................................................................................................................... 115 3.3.1 help函数 .......................................................................................................... 116 3.3.2 docString .......................................................................................................... 116 3.3.3 查看源代码 ........................................................................................... 117 3.3.4 doc属性 ........................................................................................................... 118 3.3.5 dir()函数 .......................................................................................................... 118 3.3.6 其他方法 .......................................................................................................... 119 3.4 异常处理、断言与程序调试 ....................................................................................... 119 3.4.1 try/except/finally .............................................................................................. 121 3.4.2 异常/错误信息的显示模式 ............................................................................. 122 3.4.3 断言与检查点的设置 ....................................................................................... 123 3.4.4 调试程序的基本方法 ....................................................................................... 124 3.5 数据文件的读写 .......................................................................................................... 127 3.5.1 搜索路径 .......................................................................................................... 128 3.5.2 当前工作目录 .................................................................................................. 130 3.5.3 文件读写方法 .................................................................................................. 131 3.6 面向对象编程 .............................................................................................................. 131 3.6.1 类的定义方法 .................................................................................................. 132 3.6.2 类中的特殊方法 .............................................................................................. 133 3.6.3 类之间的继承关系........................................................................................... 135 3.6.4 私有属性及@property装饰器 ........................................................................ 136 3.6.5 self和cls ......................................................................................................... 136 3.6.6 new与init的区别和联系 ................................................................................ 137 小结 ....................................................................................................................................... 138 习题3 ................................................................................................................... 139 第4章 数据准备与加工 学习指南 ............................................................................................................................... 141 4.1 随机数 .......................................................................................................................... 141 4.1.1 一次生成一个随机数 ....................................................................................... 142 4.1.2 一次生成一个随机数组 ................................................................................... 143 4.2 多维数组 ...................................................................................................................... 144 4.2.1 创建方法 .......................................................................................................... 147 4.2.2 主要特征 .......................................................................................................... 148 4.2.3 切片读取 .......................................................................................................... 149 4.2.4 浅拷贝和深拷贝 .............................................................................................. 153 4.2.5 形状与重构 ...................................................................................................... 153 4.2.6 属性计算 .......................................................................................................... 156 4.2.7 ndarray的计算 ................................................................................................. 157 4.2.8 ndarray的元素类型 ......................................................................................... 158 4.2.9 插入与删除 ...................................................................................................... 159 4.2.10 缺失值处理 .................................................................................................... 160 4.2.11 ndarray的广播规则 ....................................................................................... 160 4.2.12 ndarray的排序 ............................................................................................... 162 4.3 数据框 .......................................................................................................................... 162 4.3.1 创建方法 .......................................................................................................... 164 4.3.2 查看行或列 ...................................................................................................... 165 4.3.3 切片方法 .......................................................................................................... 166 4.3.4 索引操作 .......................................................................................................... 168 4.3.5 删除或过滤行/列 ........................................................................................... 169 4.3.6 算术运算 .......................................................................................................... 172 4.3.7 描述性统计 ...................................................................................................... 174 4.3.8 数据排序 .......................................................................................................... 176 4.3.9 导入/导出 ....................................................................................................... 177 4.3.10 缺失数据处理 ................................................................................................ 178 4.3.11 分组统计 ........................................................................................................ 182 4.4 Key-Value型数据 ........................................................................................................ 183 4.4.1 Series的主要特点 ............................................................................................ 184 4.4.2 Series的定义方法 ............................................................................................ 185 4.4.3 Series的操作方法 ............................................................................................ 187 4.5 时间与日期类型数据 ................................................................................................... 189 4.5.1 定义方法 .......................................................................................................... 190 4.5.2 转换方法 .......................................................................................................... 192 4.5.3 显示系统当前时间........................................................................................... 193 4.5.4 计算时差 .......................................................................................................... 194 4.5.5 时间索引 .......................................................................................................... 194 4.5.6 period_range()函数 ......................................................................................... 196 4.6 数据可视化 ........................................................................... 196 4.6.1 Matplotlib 可视化 ............................................................................................ 197 4.6.2 改变图的属性 .................................................................................................. 199 4.6.3 改变图的类型 .................................................................................................. 201 4.6.4 改变图的坐标轴的取值范围 ........................................................................... 202 4.6.5 去掉边界的空白 .............................................................................................. 203 4.6.6 在同一个坐标上画两个图 ............................................................................... 204 4.6.7 多图显示 .......................................................................................................... 205 4.6.8 图的保存 .......................................................................................................... 205 4.6.9 散点图的画法 .................................................................................................. 206 4.6.10 Pandas可视化 ................................................................................................ 206 4.6.11 Seaborn可视化 .............................................................................................. 208 4.6.12 教师工资收入的可视化分析 ......................................................................... 211 小结 ....................................................................................................................................... 212 习题4 ......................................................................................................... 212 第5章 数据分析算法与模型 学习指南 ............................................................................................................................... 215 5.1 基于Python的统计学编程.......................................................................................... 215 5.1.1 女性身高数据的回归分析 ............................................................................... 217 5.1.2 广告投放及销售额分析.................................................................................. 226 5.2 基于Python的机器学习编程 ...................................................................................... 230 5.2.1 威斯康星乳腺癌数据分析及自动诊断 ........................................................... 231 5.2.2 不同国家蛋白质消费结构分析 ....................................................................... 238 小结 ....................................................................................................................................... 244 习题5 .................................................................................................................................... 245 第6章 自然语言处理与图像处理 学习指南 ............................................................................................................................... 247 6.1 自然语言处理 .............................................................................................................. 248 6.1.1 自然语言处理的常用包.................................................................................. 248 6.1.2 自然语言处理的包导入与设置 ....................................................................... 248 6.1.3 数据读入 .......................................................................................................... 249 6.1.4 分词处理 .......................................................................................................... 249 6.1.5 自定义词汇 ...................................................................................................... 250 6.1.6 停用词处理 ...................................................................................................... 253 6.1.7 词性分布分析 .................................................................................................. 254 6.1.8 高频词分析 ...................................................................................................... 255 6.1.9 词频统计 .......................................................................................................... 256 6.1.10 关键词分析 .................................................................................................... 258 6.1.11 生成词云 ........................................................................................................ 258 6.2 人脸识别与图像处理 ................................................................................................... 260 6.2.1 安装并导入opencv-python包 ......................................................................... 260 6.2.2 读取图像文件 .................................................................................................. 261 6.2.3 将RGB图像转换为灰度图 ............................................................................. 261 6.2.4 人脸检测与绘制长方形 ................................................................................... 262 6.2.5 图像显示 .......................................................................................................... 263 6.2.6 图像保存 .......................................................................................................... 263 小结 ....................................................................................................................................... 263 习题6 .................................................................................................................................... 263
你还可能感兴趣
我要评论
|