Watson Visual Recognition で ラグビーとアメフトの違いを認識させる

Watson Visual Recognition で画像認識器がとても簡単に作れたのでまとめます。

実際やってみて驚きましたが、①学習用の画像を用意して②ドラッグ&ドロップ、本当にこれだけで認識器が完成しました。

なお、学習によって任意の認識器を構築する機能は標準プラン(有料)にしかない点に注意してください。無料プランではIBMが事前に用意した認識器を使用できるだけで、認識器の作成はできません。






 


認識器の構築

Visual Recognitionを開いて『Create classifier』をクリックすると以下の画面が表示されます。

直感的で分かりやすいですね。クラス名を定義して(ここでは『ラグビー』、『アメフト』の2種類のクラスを定義しました)、あとは該当するクラスの画像をそれぞれドラッグ&ドロップするだけです。

普段からスポーツ観戦が好きで写真を大量に撮りためていたため、それらで認識器構築しました。学習用画像が無い人は公開データであったり、”ImageSpider“などを活用してデータ収集してください。

※ImageSpider:Google画像検索と画像一括保存をしてくれるフリーソフト

画像を投入すると学習が始まります。

Watson Visual Recognitionの中身の詳細は公開されていませんが、まぁDNNとかで間違いないでしょう。(※流行りのディープラーニングです。)

おそらくクラウド側では先ほど投入した画像データをもとに『これがラグビー』『これがアメフト』というように学習が繰り返されています。


認識テスト

さて、Watson君はラグビーとアメフトを区別してくれるのでしょうか?

今回は京都大学体育会のラグビー部さんとアメフト部さんの公式HP画像でテストしました。

京都大学体育会ラグビー部:http://www.kiurfc.com/
京都大学体育会アメフト部:http://gangsters-web.com/

 

 

認識できましたね!簡単!!

でも簡単な反面、挙動が完全にブラックボックスなのは気味が悪いですね。だって認識がうまくいかなかった場合には完全にお手上げ侍になるので。。。