はじめに
2000年代から始まったと言われる第3次AIブーム。労働力不足の解消や作業工数の削減、ビックデータの活用など、様々な場面での活用が期待されています。日常的に「AI」を目にする場面も増えてきました。
同時に、「機械学習」「深層学習(ディープラーニング)」もよく耳にするようになったキーワードです。ただこれらの意味と違いについて、理解している方は少ないのではないでしょうか。
今回の記事では、AIとは何か、学習方法やそれぞれの活用場面について、また機械学習と深層学習(ディープラーニング)の違いについて解説します。
AIとは
AIとは、Artificial Intelligence(アーティフィシャル・インテリジェンス)の略称です。「Artificial」は「人工的な」、「Intelligence」は「知能/知性」の意味があり、「人工知能」と訳すことができます。「人間のような知能を持ったコンピューターシステム』と考えて概ね間違いではないのですが、明確な定義はなく、研究者によっても解釈が様々というのが現状です。
AI以外のシステム(ロボットやプログラム、ソフトウェア等)は、あらかじめ人の手によって明確に決められた計算や手順に則って実行するのに対し、AIは学習し、分類や推論をすることで、人の手を介さずとも様々な処理が実行できるようになります。その結果、これまでは難しかった大規模なデータの処理や、人間には難しい分析が可能になるのです。
AIの学習方法
AIの学習方法はそのまま「機械学習」といわれています。よく耳にする「深層学習(ディープラーニング)」は「機械学習」の手法のひとつです。それぞれ詳しく見ていきましょう。
(1)機械学習
機械学習とは、その文字の通り「機械」が「学習」していくことで、人間が自然に行っている学習同様、機械(コンピュータ)に学習させようというものです。学習した結果、プログラミングされた以上のことが実行できるようになります。
機械学習をより具体的に言うと、膨大なデータを反復的に処理し、その中に潜んでいるルールやパターン、特徴を発見します。その発見を元に、未知のデータの予測や判断ができるようになるというものです。
膨大なデータの反復処理や複雑なデータの処理は人間には難しく、逆にまだわからないデータを予測するという部分が人間の知性を表現している部分であり、「人工知能」と言えるのでしょう。
学習の際は、「特徴抽出」と呼ばれる「何に注目していくのか」を設定する必要があります。設定は人間の手で行う必要があり、この際の人間の関わり方によって、機械学習は「教師あり学習」「教師なし学習」「強化学習」の3つに分類されます。
下記をケーススタディとして比較してみましょう。
- <ケーススタディ:携帯電話が故障したか?を判断させる>
- ✅「電源が入らない」「画面が割れている」「メールが届かない」をキーワードに切り分け
- ✅「携帯本体」「電池パック」「ケーブルなどの付属品」のうち、「携帯本体」を特徴抽出する
■教師あり学習
コンピュータに、例題となる様々なデータと共に、模範解答を渡します。コンピュータは多くの回答を分析しながら、一方向に法則性を学習していきます。学習を進めるうちに、判断材料のスコアリングが正答率を上げることも学び、学習の精度も高くなります。
学習内容から推測して、学習していない事例に対しても判断することができますが、模範解答を渡した人間以上には賢くなれない限界があります。
- <ケーススタディ:携帯電話が故障したか?を判断させる>
- ✅故障診断データと共に、それぞれのデータに「故障/故障でない」を「答え」として与える
- ✅「電源が入らない」「電池の減りが早い」「メールが届かない」の順にスコアリングして正当性を上げる
■教師なし学習
教師あり学習と異なり、模範解答は与えません。コンピュータは特徴を分析しながら、自身の活動を元にデータを蓄積して、類似データのグループ分けなどを行います。解答を付与する作業がない分、すぐに開始できますが、思わぬ方へ学習の方向性が向いてしまう可能性もあるため、注意が必要です。
- <ケーススタディ:携帯電話が故障したか?を判断させる>
- ✅「メールが届かない」の症状が、「故障カテゴリ」と「設定ミスカテゴリ」に分類されてしまうことも
■強化学習
強化学習では、まとまったデータも与えられません。コンピュータ自身が置かれた環境の中で試行錯誤を繰り返し、学習を進めます。学習の進め方としては、1つの例題を与え、正解した場合は報酬が与えられ、逆に間違えた場合は報酬が与えられません。報酬の有無や報酬の高さから、最も高い報酬を得るためにコンピュータ自身が学習を改善していきます。コンピュータに自身の行動と、どういった状況に置かれているのかをしっかり認識させることが重要で、学習を繰り返すことでデータが蓄積され、精度も高まっていきます。
(2)深層学習(ディープラーニング)
深層学習は強化学習の一部とも言えますが、最も違う点は特徴抽出をコンピュータが自動で行う点です。十分なデータ量があれば、どの特徴量を参考に学習するべきかをコンピュータ自身が判断できるため、言語化しにくく、人間では判断が難しい領域でも高精度の判断が可能になります。
先に説明した機械学習では、特徴抽出は人間の手によるものですが、ここが上手くいかなくては期待した結果を得ることは難しく、故に特徴州出は職人技とも言われます。深層学習ではコンピュータが最適な特徴抽出をしてくれるため、学習精度が飛躍的にアップしました。ディープラーニングが登場し、注目を浴びている理由はここにあります。近年のAIブームの背景とも言えるでしょう。
それぞれの学習方法の活用分野は?
学習方法毎に特徴がありますが、それぞれどういった場面に向いているのかを見てみましょう。まず大きく違う点は、機械学習は構造化データの学習、深層学習は非構造化データの学習が可能です。
構造化データとは、文字の通り行と列で構造化されているデータで、Excelなどでも馴染みのあるデータです。検索や集計がしやすく、データの分析や解析に向いています。
非構造化データは逆に、構造が定義されていないデータです。例えばeメールや、企画書や契約書といった文書、画像や音声、動画のデータ、CADやデザインのデータなど、様々な場面で生成されるデータです。データベース化できないため、構造化データが向いている検索や集計には不向きです。種類とボリュームが圧倒的に多いのは非構造化データで、その比率は2:8と言われています。
(1)機械学習の活用分野
機械学習は答えが明確にわかっている分析に活用できます。学習方法別に、それぞれの活用場面をご紹介します。
- 教師あり学習
- ✅需要予測:
これまでに蓄積したデータ・トレンド・市場動向を分析⇒将来のニーズを予測 - ✅故障診断:
修理実績のデータを分析⇒故障の症状に適した部品を選択
- 教師なし学習
- ✅マーケティング:
顧客データの特徴を学習⇒見込みの高いターゲットを抽出 - ✅レコメンデーション:
全顧客の購買情報を学習⇒アイテムベース/ユーザーベースでおすすめ商品を提示
- 強化学習
- ✅ロボットや車の自動運転:
交通ルールや道路状況等、あらゆるシチュエーションに対応できる行動を学ぶ - ✅囲碁・将棋・チェスのゲーム:
勝利に至るための最適な過程を学習
(2)深層学習の活用分野
深層学習では、テーブル形式にはできないデータの分析に活用できます。活用データの種類別に、活用場面をご紹介します。
- 画像認識
- ✅顔認証:
目・鼻・口などのパーツの位置や、立体的データとして顔の特徴を認識させ、個人情報と一致するかを判断 - ✅病状診断:
過去と現在のレントゲン写真を比較して、変化した部分からがんを早期発見
- 音声認識
- ✅稼働状況判断:
工場内の音から、設備の稼働状況や人の活動状況を判断
- 言語処理
- ✅チャットボットによる対応:
よくある質問の一時対応や、顧客動向に合わせた最適なおススメ情報の提示 - ✅手書き申込書の処理:
記載内容を理解し、申込書を分類、重要事項もピックアップ
- データ予測
- ✅店舗の需要予測:
気象データと来店者数、売上を分析して、今後の集客見込とそれに伴う発注量を予測
適切な学習方法を選択して、AI分析を活用しよう
ここまででご説明した通り、AIの学習方法には種類があり、分析したい対象物や導きたい結果によって学習方法を選択することが重要です。それぞれの学習方法の特徴を考慮して、AIの技術を最大限活かしていきたいですね。
弊社のインサイドセールス支援サービス「カチット」は、「ぱぱっと(Papatto)AIスコア」を取り入れています。
「ぱぱっと(Papatto)AIスコア」ではAIを法人営業の効率化に活用すべく「ランダムフォレスト」という「教師あり学習方法」を採用しています。ランダムフォレストは分類の処理方法としては非常に優秀と言われていて、比較的速く結果を出しやすい、結果の説明がしやすい、最も重要な特徴量が一目でわかる等のメリットがあります。
過去の成約情報をAI分析して、成約した要因、成約しなかった要因を見つけ、確度の高い見込み客を割り出します。効率的な営業活動に、受注率の改善に、是非「カチット」をご活用ください。
おすすめのサービス
受注率・営業効率化UPに!スコア値の高い見込み顧客・ホワイトリストをご提供いたします。