AI技術に興味のある人必見。 IBM watson 「Visual Recognition」で機械学習を活用した画像認識を試してみよう。

f:id:daikiyano:20181025171114p:plain

今回、ITとAIに興味のある学生、人工知能の学習を始めたい方を対象に、
機械学習を活用して画像認識を体験できるIBM WatsonのVisual Recognitionについて紹介したいと思います。

IBM watsonとは

IBM watsonとはAI技術をAPI化し、クラウド上で公開しているサービスです。
IBM watsonを使用することによってAIの知識(機械学習や深層学習)を持っていない初心者の方でも簡単にAIを使うことが可能になります。

IBM watsonの概要とWatsonを使用するために必要なIBM cloudの登録方法については以下の記事で紹介していますので、見てみてください。

www.for-engineer.life

画像認識とは? Visual Recognition

現在、IBM watsonは12個のサービスを提供しています。
機械学習を活用した画像認識を試すことが目的ですので、今回使用するサービスはVisual Recognition(画像認識)です。
Visual Recognitionを使用すると画像に写っているのが物か生き物か。物であればそれは建物なのか橋なのか。生き物ならば、それが動物か人か。人ならば男か女か、年齢はどれくらいなのかを分類し判別することができます。

機械学習を活用した画像認識の流れ

学習フェーズ

機械学習を活用して画像認識をさせるためにはまず、準備した膨大なデータを学習器(アルゴリズム)にかけます。
学習器を通してデータの共通点などを学び取り、学習モデルを作成します。この一連の流れを学習フェーズと言います。

データ → 学習器(アルゴリズム) →学習モデル

推論フェーズ

次に学習モデルにかけたデータとは別のデータを学習モデルに与えます。 既に膨大なデータを取り入れ、学ばせた学習モデルなので、
そのデータを分類・予測することができ、画像認識の結果を表示することができます。この一連の流れを推論フェーズと言います。

別のデータ→ 学習器(アルゴリズム)→分類・予測 画像認識の結果

この学習フェーズと推論フェーズを行うことによって機械学習を活用した画像認識をすることができます。

学習モデルを1から作成する必要がないIBM WatsonのVisual Recognition

IBM WatsonのVisual Recognitionを活用するとすでに学習モデルが作成されているので、データを学習器にかけて、
学習モデルを作成する必要がありません。

IBM watsonのVisual Recognitionではいくつかの学習モデルがあります。

  • General

通常の画像認識の学習モデル。今回使用するのはgeneralです。

  • food

一般の画像認識のうち食べ物に特化した学習モデル。

  • Custom
    独自の学習モデルを作成が可能。

難しいと思いますので。まずはやってみましょう。

IBM watsonのVisual Recognitionを用いて画像認識を試してみよう!

f:id:daikiyano:20181025170356p:plain

Watsonの画面に行き、Visual Recognitionを選択します。

f:id:daikiyano:20181025170418p:plain

価格プランはライトを選択しましょう。
ライトは価格が無料なので、安心してください。
f:id:daikiyano:20181025170849p:plain
今回は、generalを選択します。

f:id:daikiyano:20181025170435p:plain

ツールの起動を選択。
f:id:daikiyano:20181025170458p:plain

Testを選択し、browseからPC内にある画像を選択します。

今回、私はアメリカ・サンフランシスコを訪れた際に撮ったゴールデンゲートブリッジをチョイスしました。
f:id:daikiyano:20181025171114p:plain

これで分類が完了しました。

Watsonの画像認識結果に対する確信度

画像の下にタグと数値が表示されますが、これはWatsonがデータを分類した結果とその確信度です。
ゴールデンブリッジの画像を学習器にかけた結果、Watsonは画像をbridgeと認識し、その横の数値は1.00です。これはwatsonがこの画像を橋と分類し、この分類に対しての確信度が100%であることを示しています。

この下のタグは「golden gate bridge」で数値は0.96です。
これはWatsonがこの画像を「golden gate bridge」として分類し、その分類に対しての確信度が96%であることを示しています。

以上が、IBM Watsonの画像認識です。

今回の画像認識の復習

今回の流れを推論フェーズに沿って復習して行きます。

今回、データとして「ゴールデンゲートブリッジ」を学習モデルに与えました。そして学習モデルを通して画像の分類結果を出しました。結果は、画像の下にあるタグとその確信度です。

・推論フェーズ

別のデータ→ 学習器(アルゴリズム)→分類・予測 画像認識の結果

今回の場合

ゴールデンゲートブリッジの画像→ 学習器(アルゴリズム)→分類・予測 画像認識の結果 →bridge 1.00 golden gate bridge 0.96

いかがでしたか?

機械学習というと敷居が高いイメージがありますが、IBM watsonのVisual Recognitionを活用するとAI技術に詳しくない方でも簡単に機械学習を活用した
画像認識を体験することができます。AIに興味のある学生や将来、AIエンジニアなりたい方にはおすすめの学習ツールです。

>文系エンジニア大学生の技術ブログ

文系エンジニア大学生の技術ブログ

社会が多様化していく中、大学生の学生生活も多様であるべきと考えています。主にエンジニア向けにITやプログラミングなどの技術系と大学生向けに休学、留学、海外生活、トビタテ留学、長期インターンに関する記事を書いています。