
Spark高级数据分析(第2版)
作者: [美] 桑迪 · 里扎 / [美] 于里 · 莱瑟森 / [英] 肖恩 · 欧文 / [美] 乔希 · 威尔斯
出版社: 人民邮电出版社
译者: 龚少成 / 邱 鑫
出版年: 2018-5
页数: 226
定价: 69.00元
装帧: 平装
ISBN: 9787115482525
内容简介 · · · · · ·
作为计算框架,Spark速度快,开发简单,能同时兼顾批处理和实时数据分析,因此很快被广大企业级用户所采纳,并随着近年人工智能的崛起而成为分析和挖掘大数据的重要得力工具。
本书由业内知名数据科学家执笔,通过丰富的示例展示了如何结合Spark、统计方法和真实世界数据集来解决数据分析问题,既涉及模型的构建和评价,也涵盖数据清洗、数据预处理和数据探索,并描述了如何将结果变为生产应用,是运用Apache Spark进行大数据分析和处理的实战宝典。
第2版根据新版Spark最佳实践,对样例代码和所用资料做了大量更新。
本书涵盖模式如下:
● 音乐推荐和Audioscrobbler数据集
● 用决策树算法预测森林植被
● 基于K均值聚类进行网络流量异常检测
● 基于潜在语义算法分析维基百科
● 用GraphX分析伴生网络
● 对纽约出租车轨迹进行空间和时间数据分析
● 通过蒙特卡罗模拟来评估金融风险
● 基因数据分析和BDG项目
● 用PySpark和Thunder分析神经图像数据
IT计算机精选文字高清版合集图书500本 pdf epub mobi azw3全格式下载
图灵程序设计丛书234本+图灵电子与电气工程丛书72本+图灵原版数学·统计学系列49本 PDF下载
常见问题
如何获取我想要的资源?
代找资源网不售卖任何资源,只代找资源,需要代找服务的小伙伴请添加客服QQ 1127720680
代找资源网不售卖任何资源,只提供代找服务
QQ客服
微信客服

评论0