ディープラーニング

機械を「スマート化」する機械学習の仕組み

機械学習の仕組みについて、ニューラルネットワークの種類や画像処理における活用方法とともに解説します。

ホワイトペーパー

ニューラルネットワークはマシンビジョンの未来を切り拓く技術となるのか?

このホワイトペーパーでは、筆者のPeter BehringerとDr. Florian Hoppeがニューラルネットワークの基礎知識や学習方法、ニューラルネットワークの構築に向けた準備について、以下のトピックを中心に解説します。

  • CNNの開発工程

  • 転移学習

  • CNN用のプロセッサー

機械学習とニューラルネットワークの仕組み

Vision Campus:機械学習の仕組み

コンピューターがプログラミングなしで意思決定や予測を行う、そんな夢のような話が今や現実になっています。動画・音楽配信サービスにおけるおすすめ作品の表示機能に見られるように、産業用途だけでなく、民生用途においてもAI(人工知能)の実用化と普及が進んでいます。

AIのニューラルネットワークにユーザー行動などのさまざまな情報を学習させることを「機械学習」といい、最新のテレビはもちろん、高度なビジョンシステムにもこの技術が活用されています。

機械学習の工程では、大量のデータをインプットしてニューラルネットワークを構築した後、ニューラルネットワーク上でデータを処理することで、解析結果をアウトプットします。 

機械学習の手法

機械学習の手法は、データの取り扱い方によって大きく3種類に分けられます。

  1. 教師あり学習:質問と回答をワンセットで学習する手法です。正確・不正解が明確な場合に適しています。  

  2. 教師なし学習:質問のみからデータの構造やパターンを学習する手法です。データを正確にグループ分けできるため、クラスター分析などに適しています。  

  3. 強化学習:特定の環境下で試行錯誤を繰り返しながら、最適な行動を学習する手法です。正しい行動を取るほど報酬が大きくなるため、報酬を最大化するために間違った行動を取らないようになります。  

AIの根幹となるニューラルネットワークは、その学習状況によってシステム全体の性能を大きく左右するため、Google社、Microsoft社、IBM社のような大手企業では、機械学習とデータベースの構築に多大な投資を行っています。特にGoogle社は、機械学習向けソフトウェアライブラリーTensorFlowをオープンソースで公開し、誰でもアクセスできるようにすることで、継続的な開発を推進しています。

ニューラルネットワークについて

人間の脳のような複雑な構造を持つニューラルネットワークは、大量のデータを読み込みながら、情報と情報をつなぎ合わせることで、求められる作業の精度を高めていきます。その用途は多岐にわたり、業界によってニーズが異なります。 

ディープニューラルネットワーク:DNN

ディープニューラルネットワーク:DNN

ディープラーニングを活用した技術として、複数の階層から成るニューラルネットワークをディープニューラルネットワーク(DNN)といいます。DNNの階層は入力層、出力層、隠れ層の3つに分かれており、そのうち隠れ層は互いに学習しながら、前の階層で得られた結果を次の階層へと送る役割を担っています。この隠れ層が存在することで、DNNは複雑なパターンやルールを抽出できるわけですが、高精度な結果を生成するには膨大なデータを処理しなければなりません。また、隠れ層の数が多いため、情報の流れが不透明で学習状況の把握が難しいというデメリットもあります。とはいえ、複雑な相関関係の理解と大量のデータ処理が可能であることから、分類、パターン認識などの用途においては、DNNが一般的に使用されています。  

コンボリューショナルニューラルネットワーク:CNN

コンボリューショナルニューラルネットワーク:CNN

空間的特徴の認識・評価に優れているコンボリューショナルニューラルネットワーク(CNN)は、機械学習を介して3D画像と2D画像の情報を取り込めるため、画像処理や画像解析に広く活用されています。DNNと同様に、CNNも複数の階層から構成されており、ピクセル単位の細かな画像解析が可能です。そのうち、畳み込み層は形状・パターンの比較と特徴の抽出、プーリング層は特徴マップの整理と圧縮を行い、この2つの階層が積み重なることで、解析の精度が向上していきます。なお、最終的な判定は出力層で行われますが、正確な結果を得るには大量の画像データを読み込む必要があります。

Generative Adversarial Network: GAN

敵対的生成ネットワーク:GAN

教師なし学習アルゴリズムの一種である敵対的生成ネットワーク(GAN)は、データベースの情報を学習するのではなく、生成ネットワークと識別ネットワークの2種類のネットワークを競わせる仕組みになっています。その際、生成ネットワークは実サンプルと生成サンプルを提供し、識別ネットワークは評価と識別を行います。そして、生成と識別を繰り返しながら、ネットワークが互いに学習し、改善を続けることで、最終的に高精度なサンプルが生成されます。このように、データの解析ではなく、データの生成を目的としている点で、GANはCNNやDNNと大きく異なります。

人間には難しい人膨大なデータの評価・解析を可能にする技術として、機械学習とAIは、以下のような用途で普及が進んでいます。

  • ロボットの物体・画像認識

  • 監視システムの生体顔認証  

  • 自動運転の警報発出  

  • 自動翻訳  

  • 自動倉庫管理

以上のように、"機械学習"とAIは、幅広い業界の多種多様な用途に導入されています。もちろん、画像処理も例外ではありません。Baslerでは、機械学習を活用したビジョンソリューションもご提供していますので、ぜひお気軽にご相談ください。  

機械学習関連製品

製品の選定に関してご不明点がある場合や個別のご相談をご希望の場合は、いつでもお気軽にお問い合わせください。