关于我们
书单推荐
新书推荐

Apache Spark大数据分析 基于Azure Databricks云平台

Apache Spark大数据分析 基于Azure Databricks云平台

定  价:79.8 元

        

  • 作者:[瑞典]罗伯特·伊利杰森(Robert Ilijason)
  • 出版时间:2023/6/1
  • ISBN:9787115614568
  • 出 版 社:人民邮电出版社
  • 中图法分类:TP274 
  • 页码:236
  • 纸张:
  • 版次:01
  • 开本:小16开
9
7
6
8
1
7
4
1
5
1
6
5
8
Azure Databricks是一款基于云的大数据分析和机器学习平台,用于实现基于Apache Spark的数据处理,为快速增长的海量数据的处理和决策需求分析提供了良好的支撑。《Apache Spark大数据分析:基于Azure Databricks云平台》详细介绍基于Azure Databricks云平台来使用Apache Spark完成大规模数据处理和分析的方法。本书总计11章,首先介绍大规模数据分析相关的概念;然后介绍受管的Spark及其与Databricks的关系,以及Databricks的版本差异和使用方法(涵盖工作区、集群、笔记本、Databricks文件系统、数据导入/导出等内容);接着介绍使用SQL和Python分别实现数据分析的过程,数据提取、变换、加载、存储、优化技巧等高阶数据处理方法以及外部连接工具、生产环境集成等内容;最后探讨了运行机器学习算法、合并数据更新以及通过API运行Databricks、Delta流处理等高阶主题。 作为数据分析领域的入门书,本书具有很强的实用性,可供数据工程师、数据分析师和决策分析人员等学习和参考。
 你还可能感兴趣
 我要评论
您的姓名   验证码: 图片看不清?点击重新得到验证码
留言内容