ArtClass(IOI2013)をディープラーニングで解く - ｼﾞｮｲｼﾞｮｲｼﾞｮｲ

はじめに

IOI 2013 オーストラリア大会に Art Class という問題があります。

この問題は、画像データが与えられるのでその画像が

様式１（新造形主義の現代芸術） f:id:joisino:20171003140837p:plain

様式２（印象派の風景画） f:id:joisino:20171003140845p:plain

様式３（表現派のアクション・ペインティング) f:id:joisino:20171003140855p:plain

様式４（カラーフィールド・ペインティング） f:id:joisino:20171003140907p:plain

のいずれであるかを判定する問題です。

正答率が 0.9 以上になると満点が得られます。

IOI にしては珍しい機械学習的な問題であることと、ジャッジが壊れて結果が返ってこなくなったことなどで有名なので、知っている人も多いかもしれません。

問題文やデータは、 http://www.ioinformatics.org/locations/ioi13/contest/ から手に入ります。

例えば 3x3 と 65x65 の大きさの窓を作って分散を計算して、それらを使って手で決定木を作るなどすると解けます。

正答率は 99/102 = 0.97... で満点が獲得できました。

手で特徴量を作るのは面倒なのでディープラーニングでなんとかして欲しいですよね。

今回は VGG の pretrained model (with ImageNet) を使ってこの問題を解いてみました。（念の為に言っておくと、 IOI の本番では chainer も pretrained model も GPU も使うことはできません）

最終層だけ 4096 x 4 の FC 層に変えて学習しなおしました。

学習データが 4 * 9 = 36 枚しかないのでかなり厳しかったですが、augmentation(crop) してなんとか正答率 92/102 = 0.90... で満点を獲得できました。

適当に作った決定木より精度低い。悲しい。

ImageNet で前学習したモデルを使ったのが筋が悪かったかもしれません。絵画的なデータで前学習したモデルがあれば、もっと楽に満点を達成できたと思います。

テストデータに対しても少しチューニングしたので、汎化性能はさらにもう少し低いと思います。体感 accuracy は 0.8 ~ 0.85 くらいです。IOI 本番でもテストデータに対する正答率は見える（はずだった）のでよしとしましょう。

環境は python 3.5.2 + chainer 2.1.0 です。

正直今回の場合、人力特徴量抽出とハイパーパラメータチューニングの面倒さは同じくらいでした。（本末転倒）

何か間違いや質問などがあればお願いします。

最後まで読んでいただきありがとうございました。