生成AIアプリケーションエンジニアのためのモデル量子化と圧縮技術入門
生成AIアプリケーションの効率とパフォーマンスを最大化するため、モデル量子化と圧縮の基本原理から実践的な適用、評価手法までを習得します。
...
Share
モデル量子化と圧縮の基礎と主要手法
Unit 1: なぜモデルを圧縮するのか?
AIモデルの課題
圧縮のメリット
Unit 2: 量子化の基本
量子化って何?
PTQの仕組み
QATの仕組み
Unit 3: その他の圧縮手法
プルーニングでスリムに
知識蒸留の力
実践的なモデル最適化と評価
Unit 1: 最適化ツールの基礎と準備
ツール導入の第一歩
モデルの準備と変換
Unit 2: 量子化・圧縮の実践
PTQでモデルを軽く
QATで精度を保つ
モデルをさらに圧縮
Unit 3: 最適化モデルの評価と選択
推論速度を測る
精度をチェック
最適な設定を見つける