データアーキテクト向けApache Spark入門:データ管理システム設計への応用
Apache Sparkの基礎から応用までを習得し、データ管理システムの設計と最適化に活かすための実践的な知識とスキルを身につけます。
...
Share
Apache Sparkの基礎とアーキテクチャ
Unit 1: Sparkの紹介と基本概念
Sparkって何?
Sparkの心臓部
Sparkの仲間たち
Unit 2: Sparkの実行環境
Sparkを動かす場所
大規模環境でのSpark
Unit 3: Sparkジョブの最適化の基礎
Sparkの処理計画
データ処理を速くする
データ移動の最適化
Sparkによるデータパイプライン設計と最適化
Unit 1: Spark SQLとDataFramesの基礎
Spark SQLの紹介
DataFrames入門
データソースとの連携
構造化データの処理
半構造化データの処理
Unit 2: リアルタイムデータパイプライン
Spark Streamingの基礎
ストリーミングソース統合
Unit 3: Sparkエコシステムへの統合
データガバナンスとSpark
Sparkのセキュリティ
メタデータ管理とSpark
既存システムとの連携