---
title: DittoTalkingHead
emoji: 🗣️
colorFrom: blue
colorTo: purple
sdk: gradio
sdk_version: 4.19.0
app_file: app.py
pinned: false
license: apache-2.0
hardware: a100-large
preload_from_hub:
  - digital-avatar/ditto-talkinghead
---


# DittoTalkingHead - Talking Head Generation

音声とソース画像から、リアルなTalking Headビデオを生成します。

## 特徴

- 高品質なリップシンク
- 自然な表情と頭部の動き
- TensorRTによる高速推論
- 自動モデルダウンロード機能

## 使い方

1. **音声ファイル**（WAV形式）をアップロード
2. **ソース画像**（PNG/JPG形式）をアップロード
3. **生成**ボタンをクリック

## 技術仕様

- **GPU**: NVIDIA A100（推奨）
- **フレームワーク**: PyTorch
- **モデル**: DittoTalkingHead (PyTorch版)
- **モデルサイズ**: 約2.5GB

## 注意事項

- 初回実行時は、モデルの自動ダウンロードのため時間がかかります（約10-15分）
- GPU（A100）環境での実行を推奨します
- 音声ファイルは16kHz WAV形式が推奨です

## モデルソース

モデルは[digital-avatar/ditto-talkinghead](https://huggingface.co/digital-avatar/ditto-talkinghead)から自動的にダウンロードされます。

## ライセンス

Apache License 2.0