ytake Hatena

Web Application Developer

2016-2017買ってよかった書籍

最近はphpよりもSparkやKafkaといったミドルウェアを使った開発や、設計ばかりやってます。

そんな中で良い書籍がありましたので、せっかくなのでいくつか紹介します。

ビッグデータ

スケーラブルリアルタイムデータ分析入門

スケーラブルリアルタイムデータ分析入門 ―ラムダアーキテクチャによるビッグデータ処理

スケーラブルリアルタイムデータ分析入門 ―ラムダアーキテクチャによるビッグデータ処理

ラムダアーキテクチャについて詳しく書かれているのはもちろんですが、
どういう様に分析処理を作っていくべきか、説明や実装例を使って解説されているので、
アーキテクチャのイメージがつきやすい書籍です。
分析処理や、Hadoopなどを扱う場合は持っておいて損はしないと思います。

書籍のリポジトリ

github.com

参考

www.oreilly.com

www.oreilly.com

ビッグデータ分析・活用のためのSQLレシピ

ビッグデータ分析・活用のためのSQLレシピ

ビッグデータ分析・活用のためのSQLレシピ

前述のスケーラブルリアルタイムデータ分析入門とセットで持っておくと良いかもしれません。
当然ながら載っているSQLそのまま利用することはできませんが、
ミドルウェアによるQueryの違いや、後半の章などはビッグデータ系に携わるのであれば持っておいて良いと思います。
あと読みやすいです。

実際にリアルタイムなストリーミング処理ではSpark SQLとpipelineDBとかを使うことになると思いますので、
読んで実際に試してみてください。

参考

Spark SQL and DataFrames - Spark 2.2.0 Documentation

www.pipelinedb.com

詳解 Apache Spark

詳解 Apache Spark

詳解 Apache Spark

SparkのDocumentを見ながらやっていましたが、やはり日本語の書籍が欲しくて購入。
前述の2冊を読んでいると、さらにグッとあーーなるほど、という繋がりが見えて楽しいです。
MLlibやGraphXも記述がありますので、全体像を掴むにはバッチリでした。

Sparkによる実践データ解析

Sparkによる実践データ解析 ―大規模データのための機械学習事例集

Sparkによる実践データ解析 ―大規模データのための機械学習事例集

Spark1.2ベースで多少古いですが、アルゴリズムや処理のポイントが記述されているので、
phperの自分にもとてもよくわかる書籍で、
Sparkを実践的に利用していく前に読んでおくと、アーキテクチャなどを考える際にヒントとなります。

分析処理系をやる場合は、ビッグデータ系の知識がなければ難しいので、
あげた書籍はかなりおすすめです

洋書

Spark in Action

詳解 Apache Sparkのさらに突っ込んだ内容で、H2Oを組み合わせたレコメンドの例や、 しかも初心者でも置いてけぼりにされない様に小難しくなりすぎない内容だったり、
ステップアップにはとても良いと思います。

Spark in Action

Spark in Action

Akka in Action

This very good Akka guidebook と言われるくらいの本
phperの自分がscalaを理解、Akkaを理解するために購入して現時点でも読みながら触っている最中です。
買ってよかった・・・

Akka in Action

Akka in Action

実践ドメイン駆動設計の著者が書いたAkkaの実践的な本も一緒に書いましたが、
こちらはまだ全然読めておらず、そしてもっとAkkaを理解せねば。。

Reactive Messaging Patterns with the Actor Model: Applications and Integration in Scala and Akka

Reactive Messaging Patterns with the Actor Model: Applications and Integration in Scala and Akka

他にもまだ良い本何冊か書いまして、またの機会に