神絵師がtwitterに上げた神絵を収集する
色んな人がやってそうだけど自分用に作ってみました。
リポジトリです。
使い方
動作例
詳しく
動作の流れは以下の通りです。
- twitter API を使って、リストから画像を含むツイートを抽出して保存する
- 保存した画像から二次元イラストを抽出する
- 抽出した画像を slack incoming-webhook をつかってチャンネルに流す
2 が難しいところです。
神絵師が画像を投稿したからといってそれが必ずしも神絵であるとは限りません。
例えば今回の場合、神絵師が食べた焼肉の写真は slack に流れてきてほしくありません。
▲流れてきてほしくないツイートのイメージ(このアカウントは神絵師ではありません)@wafrelka 少し遅くなりましたが、今日の昼ごはんは焼肉です!! pic.twitter.com/wGGmmxxF29
— 紫乃さん (@joisino_) 2016年11月5日
写真とイラストを区別するのは意外と難しかったです。(何か良いアルゴリズムがあったら教えてください)
ディープラーニングでなんとかしたりできるんでしょうか。
今回は OpenCV の Haar Cascade で nagadomi さんのアニメ顔検出器を使わせてもらいました。
これでアニメ顔が 1 箇所以上で検出されると、イラストという判定にしました。
体感 accuracy は 7 割くらいですが、 false negative はほとんど無く、slack に流れてくるのは神絵ばかりです。
今回の場合は、網羅的に収集したいというよりは、よさそうな画像をなんとなく眺めたい用途なので、これでよしとします。
今後の課題
ソシャゲガチャ問題
神絵師がソシャゲガチャの結果画像を上げることはよくあります。
今回の場合、ソシャゲガチャの結果画像は slack に流れてきてほしくないですが、アニメ顔が含まれるため防げません。
10 連ガチャの一覧結果はまだ例外でなんとかなりそうですが、特定の一枚の結果を上げている場合、その絵を描いたのも(別の)神絵師なので、弾くのはなかなかむずかしそうです。
最後に
何か間違いや質問などがあればお願いします。
最後まで読んでいただきありがとうございました。