NLPエンジニア向け音声・テキスト変換技術入門
現代のNLPエンジニアが音声・テキスト変換技術を習得し、実践的なアプリケーション開発に活かすための入門コースです。
...
Share
音声認識(ASR)と音声合成(TTS)の基礎と評価
Unit 1: 音声認識(ASR)の基礎
ASRって何?
ASRの仕組み
ASRの評価と課題
Unit 2: 音声合成(TTS)の基礎
TTSって何?
TTSの仕組み
TTSの評価と課題
実践的なASR・TTSモデルの活用とファインチューニング
Unit 1: ASRモデルの実践
ASRモデルを使ってみよう
Whisperで文字起こし
Google Speech-to-Text
Unit 2: TTSモデルの実践
TTSモデルを使ってみよう
Google Text-to-Speech
ElevenLabsで声を作ろう
Unit 3: モデルのファインチューニング
ファインチューニングの基本
モデルをカスタマイズ