Windows10でStyleGAN2を使った画像生成(実践編1)


前回準備したStyleGAN2を使って実際に画像の学習と生成をしてみます。

 

学習用の画像を見つけてくるところから始めます。

サンプルの実行

Preparing datasetsを見て、とりあえず試してみる。

サンプルのデータセットを使うためscipyをインストールして起動するも、ダウンロードできませんでした。

 

何回かやってみてダメだったので何か変だと思ってソースを見ると、かなり大きなサイズをダウンロードしようとしているようです。

download multi-resolution TFRecords (273 GB)

他を見てもサムネイルで 2GB ある。

 

自前で作ることにします。

画像セットの作成

TFRecordsを作ってみます。

同じ様式の画像ということでいらすとやの顔アイコン(男の子・女の子)を12枚ずつお借りして、計24枚ダウンロードしました。

 

2の累乗サイズでなかったり、透過画像だと以下のようなエラーになるので、適当なフリーソフトでも使ってリサイズしましょう。

 

私はImageMagickを入れていたのでコマンド1発…と思いきや意外と試行錯誤。

最終的に以下のコマンドでコンバートしました。

 

create_from_image.tfrecords ファイルを作成できます。

Training / 学習

GPUの数、データセットのルートディレクトリ、データセットのパスを設定して学習を開始します。

mirror-augumentは鏡面画像をトレーニングに使うかみたいなやつかな。

 

これで.pklファイル(Python pickle file)が作成されますが非常に時間がかかることを覚悟してください。

24枚の128x128画像でこんな感じです。

tick 20(約1日)でいったん止めました。

 

tick 10回ごとにfake画像を生成するので見てみましょう。

fakes 10
fakes 20

実験

準備でやったコマンドで動かしてみます。

よくできてるなってのは元画像に似たやつです。

 

これはまたなんとも言い難い。

 

うーん…。

単純に学習不足か、そもそもの理解不足か。

1回の施行に時間がかかりすぎるのがつらい。

 

もうちょっと試して面白いこと出来ないか探ってみます。


コメントを残す

メールアドレスが公開されることはありません。