「ディープラーニング」という言葉だけは聞いたことがあっても、一体どのような技術なのか、どこでどのように活用されているのか具体的に理解できていない人も多いのではないでしょうか。
今回は、人工知能技術を発展させたディープラーニングについて、そのメカニズムの基礎と活用事例についてご紹介します。読み終わったときには、その潜在的な影響力の大きさを理解していただけるはずです。
ディープラーニング(深層学習)とは?
ディープラーニングの定義や、近年急速に発展してきた背景について説明します。人工知能(AI)や機械学習などとの関係性や違いについて理解しておきましょう。
ディープラーニングとは
ディープラーニング(Deep Learning、日本語では「深層学習」)とは、コンピュータに学習させる方法の一つです。経験からの学習、視覚や聴覚を通じて得られた情報に基づく適切な判断、そして知識の応用など、人間の学習プロセスと類似しています。
ディープラーニングは、人工知能(AI)の基盤となる技術です。ディープラーニング自体は人工知能ではないことに注意してください。ディープラーニングによって、人工知能は急速に知識を獲得していきます。研究や技術の進展は、実現可能なタスクを爆発的に増加させました。
ディープラーニングが作られたメカニズム
ディープラーニングは、人間の神経細胞(ニューロン)の構造をモデルとしたパターン認識アルゴリズムに基づいています。画像、テキスト、音声など大量のデータをインプットすると、コンピュータが自動的にデータに含まれる特徴(パターン)を抽出して学習します。
従来は人間がデータの特徴を抽出しなければならず、学習効率があまり高くありませんでした。しかしニューラルネットワーク(ニューロンを数理モデル化したものの組み合わせ)を多層化し、データを大量に投入することでコンピュータが複雑なデータの特徴を深く学習できるようになったのです。このニューラルネットワークの多層性こそが「ディープ」の由来となっています。
コンピュータが自動的に特徴を抽出できるようになったことで、ディープラーニングを通じた学習の効率は大幅に向上しました。2015年から2017年にかけて、ディープラーニングで囲碁を学習した人工知能「AlphaGo」が世界最強レベルの囲碁棋士3名に勝利したことからも明らかな通り、ディープラーニングは人間をもはるかに凌駕する認識精度への到達を可能としました。
ディープラーニングが発展した背景
ディープラーニングが急速に発展した背景には、コンピュータの処理能力の高度化があります。
前述の通り、ディープラーニングでは大量のデータの存在が大前提となります。近年では、ハードディスクにディープラーニングで必要な量のデータを保存することができるようになりました。GPUやクラウドなどの登場によって、ディープラーニングを行うためのコンピュータ側の処理能力も格段に向上したのです。
人間の学習・推論モデルを模した形でコンピュータに学習させれば、認識精度を高められるのではないかという仮説自体は数十年前から存在していました。しかしその仮説を現実のものとしたのは、大量のデータを保存し処理する能力だったわけです。
ディープラーニングと機械学習との違い
簡単にディープラーニングの定義を述べましたが、さらなる理解のために「機械学習」との違いを解説します。この二つも混同されがちですので注意しましょう。
機械学習とは
ディープラーニングと同じように、機械学習もまたコンピュータの学習手法の一つです。データを読み込んで反復的に学習し、特徴(パターン)を見つけ出す技術を指しています。そして学習結果を新たなデータに当てはめ、推論を行います。
機械学習には「教師あり学習」「教師なし学習」「強化学習」の3種類があります。教師とはデータの特徴を教える行為を指しています。教師あり学習では特徴と紐付けた形でデータを投入し、教師なし学習ではデータからコンピュータが自ら規則や傾向を見出して分類します。強化学習は、答えの代わりに行動と報酬を与え、最大の報酬をもらえるような行動を学習させる手法です。
ディープラーニングとの違い
ディープラーニングは、機械学習の発展版と表現できます。機械学習でもデータを基に学習と推論させることは可能だったのですが、人間が特徴を教える必要がありました。コンピュータがデータを分析する際にデータのどの部分に注目する必要があるのか、いちいち指定しなければならなかったのです。
これに対してディープラーニングでは、教師や報酬がなくても注目ポイントをコンピュータ自身が判断し、自動的に分析を行います。人間なしに学習を進められるので、データさえあれば効率的にコンピュータが賢くなっていくのです。
人間から見ると、機械学習では推論の根拠が明らかであるのに対し、ディープラーニングでは明らかではないという違いがあります。機械学習の学習プロセスにおけるロジックは明確です。しかしディープラーニングですと、データを与えれば勝手に推論するため人間にはその根拠が分かりません。
たとえば、配偶者や子供が理解できない理由で不機嫌になっていると体験をしたことのある人も多いのではないでしょうか。他人の判断根拠はしばしば理解不能です。一方で、機械は人間が設計図やプログラムに基づいて組み立てられるものなので、なぜある動作をするのか理解できます。より機械に近いのが機械学習であり、より人間に近いのがディープラーニングとも言い換えられるでしょう。
ディープラーニングの活用事例
ディープラーニングは急速に実社会にも広まっています。今後の応用可能性を考える上でも、現段階での活用事例について理解を深めましょう。
音声認識
音声認識能力を持ったAIが実用化され始めています。特にスマートフォンのアプリケーションとして実装されており、iPhoneの「Siri」やAndroidの「Google Now」は音声に対するWebサービスの利用や質問に対する回答などの機能があります。
こうしたAIアシスタント( AppleのSiri、AmazonのAlexa、GoogleのGoogle Assistant等)は、人間の発話パターンや音声パターンを学習・推論します。人間の声をテキストとして出力したり、特定の人間を識別したりします。
2017年には、GoogleやAmazonなどといったテクノロジー企業から相次いでスマートスピーカー(AIスピーカー)が発売されました。こちらにも同じようなAIアシスタントが備わっており、ディープラーニングを用いた音声認識を利用して音楽を流したりアプリケーションを使用したりすることができます。
画像認識
画像認識とは、写真や動画から特徴を自動抽出して文字や顔などを認識する技術です。画像認識の活用事例は幅広く、セキュリティや製造業、自動翻訳、自動運転などで導入実績が増えています。
たとえばセキュリティ分野では、空港の帰国手続きにおける顔認証、密漁の監視などに実績があります。製造業では、不良品の検出への活用が進んでいます。自動翻訳では、カメラを通じて文字をリアルタイムで翻訳する「Google翻訳」が登場しています。自動運転の分野では、車両や信号、歩行者や道路の白線などを検出して運転をサポートするプロセッサが開発されています。
AmazonやGoogleからは画像認識を事業者や個人が活用するためのAPI・オープンソースが公開されており、今後もさまざまなアプリケーションが登場すると考えられます。
レコメンデーション・システム
レコメンデーション・システムとは、過去の行動履歴に基づいてコンピュータが「どんな商品に顧客が関心を示すか」を予測し、商品の提案を行うシステムです。
すでに多くのECサイトで導入されています。たとえば過去の購買履歴や閲覧履歴などに基づいて、おすすめ商品が表示されるのを見たことのある人も多いでしょう。書籍や音楽、衣料品や日用品などの好みを複数のプラットフォームにまたがって判断することができます。
ディープラーニングで急速に発展したAIが世界を変える
ディープラーニングはAIの学習能力の根幹をなす技術であり、近年のテクノロジーの進展に大きく影響しています。最後にいくつか紹介したとおり、幅広い産業でディープラーニングを活用したアプリケーションが導入され、コスト削減や顧客ニーズの掘り起こしなどに貢献しています。
ディープラーニングは目に見える物体ではありませんが、社会の隅々に浸透して世界を大きく変えるほどの存在になる可能性があります。ディープラーニングを知ることは、これからの世界を知ることでもあると言えるのです。