MANGA109 Pose HA+Eの漫画画像で学習したText-Image-to-Image
このリポジトリは、MANGA109 Pose toolsの画像生成モデルです。画像生成モデルに入力する条件画像は、上記URLのレポジトリで作成してください。
学習パラメータ
引数 | 値 |
---|---|
resolution | 512 |
train batch | size 4 |
learning rate | 1e-05 |
mixed precision | fp16 |
max train steps | 400,000 |
学習データセット
MANGA109 Pose HA をtraining set,validation set,test set を8:1:1に分割し、MANGA109 Pose Eを全てtraining setに追加したデータセット。
作成者の環境
- GPU:H100NVL(1枚)
- CUDA:12.4
- PyTorch:2.6.0+cu124
- diffusers:0.33.0.dev0
計算時間
H100(NVL)94GB の1 つのGPU を用いて176 時間 1学習ステップあたり1.58 秒
License
本リポジトリは、 Attribution-NonCommercial 4.0 International (CC BY-NC 4.0) に基づいてライセンスされています。
引用
このリポジトリを研究で使用する場合は,次の Bibtex エントリを使用して引用することを検討してください.
@article{okada2025manga109pose,
title={MANGA109 に姿勢情報を追加したデータセットの構築による姿勢を制御した漫画キャラクター画像生成},
author={岡田 湧路 and 北川 峻 and 渡邉 謙吾 and 稲葉 通将 and 橋本 敦史 and 栗原 聡},
journal={人工知能学会全国大会論文集},
volume={JSAI2025},
pages={2O1GS1005-2O1GS1005}
year={2025}
}
更新履歴
- 2025/04/25: [公開]
- Downloads last month
- -
Inference Providers
NEW
This model isn't deployed by any Inference Provider.
🙋
Ask for provider support
Model tree for fev12345/Image_Generation_model_HAE_Author
Base model
stabilityai/stable-diffusion-3.5-medium