TECHNOLOGY
機械学習の種類を徹底解説!活用例も紹介します
目次
インターネットとハードウエアの発達とともに、コンピューターがみずからデータを分析して学習できる機械学習が可能になりました。機械学習は、膨大なデータをもとにコンピューターがみずからルールやパターンを学習して、予測・識別を行う技術です。本記事では、機械学習の種類や学習方法、活用事例について詳しく解説します。
▼更に機械学習について詳しく知るには?
【完全版】機械学習とは?解決できる課題から実例まで徹底解説
▼社内のデータをAI化するには?
ノーコードAIツールUMWELT紹介ページ(活用事例あり)
機械学習は4種類ある
機械学習には、教師あり学習、教師なし学習、強化学習、深層強化学習の4つの領域が存在します。ここからは、それぞれの違いや学習方法を詳しくみていきます。これらの分類は、機械学習分野を体系的に理解する際にとても重要になってきます。
入力例とターゲット出力提示がある「教師あり学習」
教師あり学習とは、 人間があらかじめ、学習データに正解を与えた状態で、機械が学習を行い、データセットに対する応答値の予測を行う学習方法です。事前に与えられたデータ(入力)を「教師からの例題」とみなして、それをもとにルールやパターンを学習するところから、この名がつけられています。教師あり学習のなかで代表的なものは、回帰分析と分類です。回帰とは、連続する数値を予測し、分類とは、あるデータがどのクラスに属するかを予測することです。
入力構造を単独で探す「教師なし学習」
教師なし学習とは、学習データに正解を与えない状態で学習させ、入力構造を単独で探す手法です。教師なし学習には、クラスタリングや敵対的生成ネットワーク、アソシエーション分析、主成分分析といったさまざまなアルゴリズムが存在します。教師あり学習と教師なし学習には、学習データに正解を与えるか、与えないかという違いがあります。そのため、正解が明確である場合には教師あり学習、不明確な場合には教師なし学習を用います。
特定の目標を達成する「強化学習」
教師あり学習や教師なし学習と異なり、強化学習は静的なデータセットに依存せず、動的な環境で動作し、収集した経験から学習します。強化学習の大きな特徴は、環境とソフトウェアエージェント間でのやりとりを通して学習中に経験を収集する点です。そのため、教師あり学習や教師なし学習では必要とされる、学習前のデータ収集や前処理、ラベル付けが不要になります。つまり、適切なインセンティブがあれば、強化学習モデルは、人間が監視することなく、それ自体で行動の学習を開始できるのです。
ディープラーニングを取り入れた「深層強化学習」
深層強化学習とは、強化学習とディープラーニングを組み合わせた学習方法(DQN: Deep Q Network)です。強化学習とは、人工知能にトライアンドエラーをさせ、正解や目標に近づいた際に報酬を与える学習法です。ディープラーニングは深層学習とも呼ばれ、機械学習の一手であるニューラルネットワークを応用した技術です。ディープラーニングは、人間と同じように、機械がみずから考え、判断できる高度な技術といえます。強化学習の一手法であるQ学習とディープラーニングを併用することで、次の方針を決定する際に最善の行動をとれるようになり、コスト削減や時間短縮へとつなげられます。
機械学習で用いられるアルゴリズムの種類
アルゴリズムは、コンピューターに仕事をさせるときの基盤となる計算の手順、やり方です。ここからは、機械学習で用いられる8つのアルゴリズムについて、それぞれの内容を解説します。
決定木・ランダムフォレスト
決定木とは、ある条件に基づいて、何らかの意思決定を助けるために用いられる木構造です。因果関係が明確な事象の場合、決定木を用いて分析され、主にデータマイニングで用いられます。機械学習において、代表的なアルゴリズム「ランダムフォレスト」は、この決定木を使用して分類や回帰分析を行います。
k平均法
k平均法とは、大量のデータのなかから似ているものを集めて分類する、クラスタリングを行うためのアルゴリズムです。そのなかでも、あらかじめラベリングされていない、数の塊によってサンプルを分割するのが特徴の「非階層クラスター分析」に該当し、サンプル数が膨大な、ビッグデータを分析する際に最適な手法といえます。
ロジスティック回帰
ロジスティック回帰とは、ある事象の発生率を予測したり、確率を判断したりする手法です。 ロジスティック回帰では、入力値0から1の間に収める関数で、グラフにした時にゆるやかな曲線を描く「シグモイド関数」を使用します。主に、見込み客を予測するといったマーケティング分野で多用されています。将来的には、病気や災害の発生予測など、高い精度が求められる分野での活用も期待されています。
サポートベクターマシン
サポートベクターマシン(Support Vector Machine、SVM)は、教師あり学習に用いられるアルゴリズムです。認識性能に優れているため、画像のパターン認識を行う際に活用されます。また、「マージン最大化」という識別関数を決定する明らかな基準があり、未学習のデータに対して、応用力が高いというメリットがあります。また、カーネル関数を用いて、高次元の特徴空間にデータを埋め込むことで、線形分類器では対応しきれない非線形分類問題にも対応できるようになりました。
ニューラルネットワーク
ニューラルネットワークは、思考をつかさどる神経細胞「ニューロン(neuron)」を語源としています。人間は、脳内にある100億個以上のニューロン間で電気信号を送り、情報処理を行っています。人間の脳の構造をモデルにしたアルゴリズムは、AIのもととなるもので、ニューラルネットワーク(神経回路網)と呼ばれています。人間の脳は、経験や学習により成長していきます。ニューラルネットワークも同様に、学習をすることで、高度な処理や判断ができるようになります。まず、コンピューターに判断材料となる情報を入力し(入力層)、その情報をもとにネットワークを介して複雑な計算を行い(中間層)、判断結果となる正解を出力(出力層)します。すなわち、入力-出力間の複雑な計算を行う中間層こそが、ニューラルネットワークにおいて重要なポイントとなるのです。入出力が行われる対象は、分析や予測、モノの認識、音声認識など多岐にわたります。
ニアレストネイバー法
ニアレストネイバー法はk近傍法とも呼ばれ、教師あり学習の分類アルゴリズムです。あらかじめ既存データを覚えておき、未知のデータと類似した既存データを利用する単純な手法です。この手法のメリットは、シンプルなアルゴリズムであるため、さまざまな問題に適用しやすく、予測結果が理解しやすい点です。また、学習フェーズが存在しないため、データを準備でき次第、すぐに解析を始められるのも利点といえます。
クラスタリング
クラスタリングとは、教師なし学習のひとつで、データ間の類似性にもとづいて、データをグループ分けする手法です。類似したデータが集まったグループのことを「クラスタ」と呼びます。各データがひとつのグループのみに所属するよう、グループ分けする「ハードクラスタリング」と、各データが複数のグループに所属することを認め、グループ分けする「ソフトクラスタリング」に分けられます。
次元削減
次元削減とは、データの次元数を減らすことで、その主な目的は、データの圧縮や画像データのノイズ処理にあります。データセットが膨大になりやすい機械学習の分野において、データを圧縮することで高速計算を行えるようになります。
機械学習の活用例
予測技術とは、集積データを用いて未来の事象の発生や未来の値の予測をするもので、活躍の場は多岐にわたります。2020年11月、Googleは、国内の新型コロナウィルス感染症の陽性者数・死亡者数を予測するサービス「COVID-19感染予測(日本版)」を開始しました。今後28日間における感染状況が、どのように推移するか予測をするものです。また、Facebook は、新型コロナウィルス感染症に罹患した患者への治療に活用できるAIモデルを開発しました。患者の容体悪化に関する予測や必要となる酸素の量などを予測します。
音声を文字に変換する「音声認識」
音声認識とは、コンピューターで音声データを文字に変換する技術です。AmazonやAppleなど多くの企業が、AIによるアシスタント機能が備わったスマートスピーカーを開発しています。天気予報やニュースの読み上げ、音楽、動画の再生、家電の操作まで、音声でさまざまなアクションを実行できるようになりました。
人の顔を判別できる「顔認識」
顔認識とは、機械に目や鼻、口といった特徴となる部分をパターン化し、膨大な「人の顔のデータ」を学習させ、人の顔を判別させる方法です。スマホの本人確認や、オフィスのセキュリティ対策、成田空港の出入国ゲートなど、顔認識技術の活用は徐々に浸透し始めています。
機械学習ができる有能なAIを活用しよう!
機械学習ができる有能なAIを効果的に活用するには、トライエッティングの「UMWELT(ウムヴェルト)」がおすすめです。UMWELTのなかには、常時100種類ものアルゴリズムを搭載し、自由に組み合わせることで、どのようなデータでも、簡単に、高度なアルゴリズムを構築することが可能です。企業ごとに異なるデータフォーマットをUMWELTが「標準化」することで、自社にぴったりの活用方法を作り出すことができます。
まとめ
本記事では、機械学習の種類から学習方法、そして具体的な活用事例について、解説してきました。DX推進が叫ばれる昨今、機械学習ができるAIについて必要性を痛感している企業は少なくありません。一方で、「自社に有益なAIを導入したいが、何から始めたらよいかわからない」「専門的な知識がなく、困っている」という方も多いかと思います。ファーストステップとして、トライエッティングの「UMWELT」を導入してみませんか。UMWELTであれば、短期間かつ低コストで社内への導入が実現可能ですので、ぜひ一度弊社までお問い合わせください。
UMWELTのサービスページをチェックする
TRYETING
公式
TRYETING公式アカウントです。
お知らせやIR情報などを発信します。