生成AIアプリケーションエンジニアのためのモデル量子化と圧縮技術入門

生成AIアプリケーションの効率とパフォーマンスを最大化するため、モデル量子化と圧縮の基本原理から実践的な適用、評価手法までを習得します。

モデル量子化と圧縮の基礎と主要手法

Unit 1: なぜモデルを圧縮するのか?

Unit 2: 量子化の基本

Unit 3: その他の圧縮手法

実践的なモデル最適化と評価

Unit 1: 最適化ツールの基礎と準備

Unit 2: 量子化・圧縮の実践

Unit 3: 最適化モデルの評価と選択