Spaces:
Runtime error
Runtime error
File size: 2,738 Bytes
d291c0c d9e1dac d291c0c d9e1dac 910f2aa d9e1dac 910f2aa d9e1dac 910f2aa 0f839d2 910f2aa d291c0c |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 |
---
title: TalkingAvater Bgk
emoji: ⚡
colorFrom: red
colorTo: purple
sdk: gradio
sdk_version: 5.38.0
app_file: app_optimized.py
pinned: false
---
# DittoTalkingHead - Talking Head Generation (Phase 3 最適化版)
音声とソース画像から、リアルなTalking Headビデオを生成します。
## 🚀 Phase 3 最適化機能
- **解像度320×320固定**: 処理速度を約50%向上
- **GPU最適化**: Mixed Precision、torch.compile対応
- **アバターキャッシュ**: 画像を事前アップロードして高速化
- **Cold Start最適化**: モデルロード時間を短縮
## 使い方
### Web UI
1. **音声ファイル**(WAV形式)をアップロード
2. **ソース画像**(PNG/JPG形式)をアップロード
3. **生成**ボタンをクリック
### API経由での使用
#### Python クライアント
```bash
pip install "gradio_client>=1.11.0"
```
```python
from gradio_client import Client, handle_file
client = Client("O-ken5481/talkingAvater_bgk")
result = client.predict(
audio_file=handle_file("path/to/audio.wav"),
source_image=handle_file("path/to/image.png"),
api_name="/process_talking_head"
)
```
#### 高度なクライアント(タイムスタンプ付き保存)
```python
from test_api_client import TalkingHeadAPIClient
client = TalkingHeadAPIClient()
saved_path, status = client.process_with_save(
audio_path="example/audio.wav",
image_path="example/image.png"
)
```
### テストの実行
```bash
# 基本的なAPIテスト
python test_api.py
# カスタムテストクライアント
python test_api_client.py
```
## 技術仕様
- **モデル**: DittoTalkingHead (PyTorch版)
- **GPU**: NVIDIA A100推奨
- **初回実行時**: モデルのダウンロード(約2.5GB)
- **処理速度**: 16秒の音声を約15秒で処理(Phase 3最適化により50-65%高速化)
## ドキュメント
- 📁 **[APIドキュメント](docs/api/)** - リアルタイムを超える動画生成APIの全ドキュメント
- 🚀 [統合ガイド](docs/api/integration_guide.md) - 完全なAPIインテグレーションガイド
- ⚡ [クイックリファレンス](docs/api/quick_reference.md) - 5分で実装できるクイックスタート
- 📝 [API仕様書](docs/api/documentation.md) - 詳細なAPI仕様とサンプルコード
- 💻 [統合サンプル集](docs/api/integration_examples.py) - 実装例とベストプラクティス
- 📋 [Phase2実装仕様](ToDo/0717-2_Phase2_API_SOW.md) - API実装の詳細
- 🔧 [Phase3最適化ガイド](docs/phase3_optimization_guide.md) - パフォーマンス最適化の詳細
Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference
|