MANGA109 Pose HA+Eの漫画画像で学習したText-Image-to-Image

このリポジトリは、MANGA109 Pose toolsの画像生成モデルです。画像生成モデルに入力する条件画像は、上記URLのレポジトリで作成してください。

学習パラメータ

引数	値
resolution	512
train batch	size 4
learning rate	1e-05
mixed precision	fp16
max train steps	400,000

学習データセット

MANGA109 Pose HA をtraining set，validation set，test set を8:1:1に分割し、MANGA109 Pose Eを全てtraining setに追加したデータセット。

作成者の環境

GPU：H100NVL（1枚）
CUDA：12.4
PyTorch：2.6.0+cu124
diffusers:0.33.0.dev0

計算時間

H100(NVL)94GB の1 つのGPU を用いて176 時間 1学習ステップあたり1.58 秒

License

本リポジトリは、 Attribution-NonCommercial 4.0 International (CC BY-NC 4.0) に基づいてライセンスされています。

引用

このリポジトリを研究で使用する場合は，次の Bibtex エントリを使用して引用することを検討してください．

@article{okada2025manga109pose,
  title={MANGA109 に姿勢情報を追加したデータセットの構築による姿勢を制御した漫画キャラクター画像生成},
  author={岡田 湧路 and 北川 峻 and 渡邉 謙吾 and 稲葉 通将 and 橋本 敦史 and 栗原 聡},
  journal={人工知能学会全国大会論文集},
  volume={JSAI2025},
  pages={2O1GS1005-2O1GS1005}
  year={2025}
}

更新履歴

2025/04/25: [公開]

fev12345
/

Image_Generation_model_HAE_Author