データエンジニアのためのPython入門:PandasとPyArrow
データエンジニアリングの基礎を築くため、Pandasによる効率的なデータ操作とPyArrowによる高性能なデータ処理を習得します。
...
Share
Pandasによるデータ操作の基礎と応用
Unit 1: Pandasの基本構造を理解する
Pandasって何?
Seriesの基本
DataFrameの基本
Unit 2: データ操作の必須スキル
データ選択とフィルタリング
欠損値との戦い
データの整形と変換
Unit 3: データ集計とファイルI/O
集計とグループ化
ファイルとのやり取り
PyArrowを活用した高性能データ処理とParquetファイル操作
Unit 1: Apache ArrowとPyArrowの基礎
Arrowとは?
PyArrowの導入
PandasとPyArrowの連携
Unit 2: Parquetファイル操作の深化
Parquetの基礎
PyArrowでParquet読み書き
Parquetのパーティショニング
Unit 3: パフォーマンス最適化とベストプラクティス
メモリ管理のヒント
高速化の秘訣