--- title: DittoTalkingHead emoji: 🗣️ colorFrom: blue colorTo: purple sdk: gradio sdk_version: 4.19.0 app_file: app.py pinned: false license: apache-2.0 hardware: a100-large preload_from_hub: - digital-avatar/ditto-talkinghead --- # DittoTalkingHead - Talking Head Generation 音声とソース画像から、リアルなTalking Headビデオを生成します。 ## 特徴 - 高品質なリップシンク - 自然な表情と頭部の動き - TensorRTによる高速推論 - 自動モデルダウンロード機能 ## 使い方 1. **音声ファイル**(WAV形式)をアップロード 2. **ソース画像**(PNG/JPG形式)をアップロード 3. **生成**ボタンをクリック ## 技術仕様 - **GPU**: NVIDIA A100(推奨) - **フレームワーク**: PyTorch - **モデル**: DittoTalkingHead (PyTorch版) - **モデルサイズ**: 約2.5GB ## 注意事項 - 初回実行時は、モデルの自動ダウンロードのため時間がかかります(約10-15分) - GPU(A100)環境での実行を推奨します - 音声ファイルは16kHz WAV形式が推奨です ## モデルソース モデルは[digital-avatar/ditto-talkinghead](https://huggingface.co/digital-avatar/ditto-talkinghead)から自動的にダウンロードされます。 ## ライセンス Apache License 2.0