sidebar-banner-umwelt

BUSINESS

ロジスティック回帰モデルとは?利用シーンや導入の具体事例を紹介

ロジスティック回帰モデルとは?利用シーンや導入の具体事例を紹介

ロジスティック回帰モデルは、ビジネスのマーケティング施策や医療、金融、気象などのさまざまな分野で使える統計手法です。ロジスティック回帰で計算した予測値は、ビジネスにおける今後の対応・対策に役立ちます。しかし、ロジスティック回帰モデルを深く知らない方もいるのではないでしょうか。

この記事では、ロジスティック回帰モデルの基礎知識と種類、注意点を紹介します。記事を読むことで、より良いマーケティング施策が立てられるでしょう。

ロジスティック回帰モデルに関する基礎知識


ロジスティック回帰モデルは、確率の答えを2つに分ける回帰分析の統計手法です。ロジスティック回帰によって確率を分類すれば、マーケティングにおける利益拡大や業務の最適化に役立ちます。

ここでは、ロジスティック回帰モデルとは何か、計算式や他の回帰分析との違いを紹介します。

ロジスティック回帰モデルとは?

ロジスティック回帰モデルとは、複数の要因「説明変数」から2値の結果「目的変数」の発生確率を予測する統計手法です。2値の結果とは「合格・不合格」「採用・不採用」など、答えが2つしかない場合を指します。

確率は、基本的に0から1の範囲でしか判断できません。しかし、通常の回帰分析では、-0.2や1.2など範囲を超えた予想確率が出る場合もあります。ロジスティック回帰は、ロジット変換によって予測確率を0から1に収める手法です。

ロジット変換とは、成功の確率を失敗の確率で割るオッズの自然対数です。このオッズを関数で表したものがロジット関数で、ロジット関数からロジスティック回帰モデルが作成できます。

【ロジット関数】
logit(p)=log(p/1-p)

【ロジスティック回帰モデルの計算式】(ロジスティック関数)
p=1/1+exp(-(b0+b1×x1+b2×x2+b3×x3))

※pは目的変数、x1~x3は説明変数、b0は切片、b1~b3は回帰係数、expは自然対数の底を表します。

説明変数と目的変数で影響度を見る

ロジスティック回帰は、説明変数が目的変数に与える影響度も計算できます。説明変数がどのくらい目的変数に関係しているかを知るには、オッズが必要です。

オッズは、成功の確率と失敗の確率の比を表す数値です。複数のオッズを比較すれば、どの説明変数の影響度が高いかが分かります。オッズは以下の式で求められます。

p(成功の確率)/1-p(失敗の確率)

【例】
講習を受けて試験に臨んだ人数が10人、合格した人数が6人の場合のオッズ
0.6/(1-0.6)=1.5

講習を受けずに試験に臨んだ人数が10人、合格した人数が4人の場合のオッズ
0.4/(1-0.4)=0.6(小数点第二位以下切り捨て)

講習を受けた人と受けていない人のオッズ比は、1.5/0.6=2.5です。オッズ比が1よりも大きいため、講習を受けた人が合格しやすいことが分かります。

線形回帰との関係

線形回帰とロジスティック回帰は、回帰分析の種類です。回帰分析は、目的変数と説明変数の関係を調べるために用いられます。

線形回帰は、目的変数と説明変数の間に線形の関係があると仮定し、連続した目的変数を予測します。説明変数がひとつの場合は「単純線形回帰」、複数の説明変数があれば「重回帰」です。

経済分野の需要予測や気象データを用いた気温予測に活用できます。線形回帰の計算式は以下の通りです。

p=a+bx

ロジスティック回帰は、目的変数と説明変数の間に非線形の関係があり、目的変数が2値のどちらに属するかを予測するために用います。ロジック変換を使って確率を出し、結果を2つに分類する手法です。医療分野の疾患の発症予測やスポーツ分野の試合結果の予測に活用できます。

重回帰との関係

重回帰とロジスティック回帰は、複数の説明変数から目的変数を計算する点は共通していますが、目的変数の表し方が異なります。

ロジスティック回帰は、ロジック変換で目的変数を0から1の間の数値にして2つに分類します。0.5未満の確率は0、0.5以上の確率は1です。

重回帰は、目的変数を実数で表します。ロジスティック回帰が質的な結果を求めるものなら、重回帰は量的な予測値を求める手法です。そのため、重回帰の予測値は0以下や1以上もあります。

使用するプログラミング用語

ロジスティック回帰モデルの作成には、プログラミング言語の「Python」や「R」を用います。

Pythonは、オブジェクト指向型のスクリプト言語です。ライブラリが豊富で、機械学習やAIの分野で活用されます。日本語の情報が少ないという難点はありますが、初心者でも扱いやすく、汎用性が高いのが魅力です。

Rは、統計解析やデータ解析で活用することを前提に開発した言語です。統計分野に特化しており、パッケージが豊富にそろっています。汎用性はありませんが、他の言語ツールとの互換性が高く、Excelにデータを読み込める点がメリットです。

どちらもデータ分析のためのライブラリがそろっており、簡単に高度な予測モデルが組めます。

ロジスティック回帰が機械学習の面で重要な理由

ロジスティック回帰は、機械学習の「教師あり学習」に属します。教師あり学習とは、正解を与えたデータを基に学習を進める手法です。答えが明確な問題の解決に適しています。

ロジスティック回帰を使えば、予測分析に必要なインサイトを得られるため、実用的な機械学習モデルの構築が可能です。機械学習モデルの活用により、業務効率の向上や運用コストの削減が見込めます。

ロジスティック回帰のメリットは、シンプルな操作で実装できることや大量のデータを高速処理できることです。他にも、広い範囲のデータを0か1の狭い範囲のデータに置き換えることで、より高度で正確な分析もできます。

ロジスティック回帰を使用した機械学習は、マーケティング施策に重要な役割を果たすでしょう。

ロジスティック回帰モデルの種類


ロジスティック回帰モデルは、目的変数のタイプによって3つの種類に分けられます。基本的には2値の結果を予測する際に使用しますが、3つ以上の結果を予測するモデルもあるため、理解できればより高度な分析ができるでしょう。

ここでは、ロジスティック回帰モデルの種類を3つ紹介します。

二項ロジスティック回帰

目的変数が0か1になるのが、二項ロジスティック回帰です。「合格・不合格」「発生する・発生しない」など、2つの答えがある予測に使います。ロジット関数を使った計算ができるのは、二項ロジスティック回帰のみです。

多項ロジスティック回帰

多項ロジスティック回帰とは、目的変数が3つ以上あるものです。例えば、カラー展開が多い商品の購入確率や音楽アプリケーションの再生回数、放映している映画の鑑賞確率などを予測する際に使用します。

目的変数の結果に順序はありませんが、より顧客に影響を与える商品・音楽・映画を予測できるため、マーケティング施策に役立てやすいモデルです。

序数ロジスティック回帰

3つ以上の目的変数と序列があるのが、序数ロジスティック回帰です。例えば、スマートフォンのカラー展開5種類に対して「欲しい」から「要らない」までを5段階評価で計算します。

このモデルを作成すれば、色の評価と実際の売り上げとの関係を確認できるでしょう。「評価は高くても売り上げは伸びなかった」「評価は低かったのに売り上げが伸びた」といった結果で、マーケティング宣伝活動が改善できます。

article-banner-umwelt-middle

ロジスティック回帰モデルの注意事項


ロジスティック回帰モデルは、複数の説明変数があれば2値の目的変数を求められます。しかし、モデルの作成には注意点もあります。正確な数値で計算しなければ曖昧な予測値しか算出できないため、正しい結果にはなりません。

ここでは、ロジスティック回帰モデル作成時の注意点を3つ紹介します。

説明変数には条件がある

ロジスティック回帰の説明変数には、調査していないデータや数値が曖昧なデータは使用できません。例えば、説明変数に販売期間を入れるケースを考えてみましょう。商品の欠品で販売停止期間があった商品は、他の商品とのオッズ比が求められません。

また、ロジスティック回帰分析は数量データ、もしくは2値のデータを基本的に使用します。目的変数が3つになる場合、多項ロジスティック回帰を使うことから通常の計算式では求められません。

他にも、3つの説明変数を用いる場合、そのうち2つが同じ値であれば説明変数として使えないため注意しましょう。

Excelでも計算できる?

ロジスティック回帰は、Excelでも計算できます。通常はPythonやRで分析しますが、Excelにあるさまざまな関数を活用すれば、比較的簡単に分析できるでしょう。

計算の手順は以下の通りです。

1.データをExcelに反映する
2.EXli関数・SUMliRODUCT関数を用いて、推定値を設定する
3.データごとの対数尤度(たいすうゆうど)を求めるために、LN関数を設定する
4.全ての対数尤度を求められるよう、SUM関数を設定する
5.ソルバー機能を用いて、偏回帰係数を計算する

ロジスティック回帰の成功事例

米国のIBMは、ロジスティック回帰モデルの成功例として銀行の信用評価や利益分析を挙げています。銀行の融資担当者は、債務不履行になる可能性が高い人の特性をロジスティック回帰で識別しました。

例えば、850人の顧客に関する情報を持っている場合、貸し付けをした700人の中から無作為にロジスティック回帰モデルを作成します。このモデルを使用し、150人の見込み顧客を信用リスクで分類しています。

また、ある銀行は顧客に適切なサービスと商品の提供を目的に、予測分析とロジスティック回帰分析を活用しました。その結果、意思決定を改善し、顧客とのやりとりを最適化しています。

UMWELTはマーケティングに活用できる


ロジスティック回帰は、複数の要因から結果を予測します。マーケティング分野で考えると、年齢や性別などの説明変数を基に、商品の売上予測ができます。

UMWELTは、機械学習ができる業務効率化プラットフォームです。ここでは、UMWELTの魅力を紹介します。

ロジスティック回帰の知識がなくても導入できる

UMWELTは、ノーコード予測AIです。専門的な知識がなくても、マーケティングに必要な需要予測や売上予測を作成できます。POSやExcelなどCSVで管理している3列データだけで分析・計算が可能です。

また、在庫管理や自動発注などの機能も利用できます。導入する際は専門家が伴走するプランもあるため、アドバイスを受けながらマーケティング施策ができるでしょう。

導入事例を紹介

WILLER EXPRESS株式会社様は、高速バス事業や鉄道事業、MaaS事業など、人の移動ソリューションを提供する企業です。イールドマネジメントをAIで効率化するためにUMWELTを導入しました。

路線によって特性が異なるため、路線別の需要予測や価格調整が必要でした。客観的、かつ数学的に本来のポテンシャルを測れば、機会損失を防げるという考えで導入に至っています。

今後は、会員施策やマーケティング施策も絡めた上での最適化を視野に入れています。

(参考: 『【WILLER EXPRESS様】UMWELT活用事例|イールドマネジメントを軸に需要予測や広告施策最適化を検証|TRYETING』

まとめ

ロジスティック回帰モデルは、説明変数から目的変数の発生確率を予測する手法です。実数値ではなく質的な結果を予想できるため、マーケティング分野の需要予測や売上予測に役立ちます。

ノーコードAIのUMWELTは、ロジスティック回帰の知識がなくても機械学習を導入できます。他にも、在庫管理や自動発注などの機能を搭載しており、業務の効率化を支えるツールです。無料相談も受け付けていますので、お気軽にご相談ください。

UMWELTのサービスページをチェックする

AI予測ツールUMWELT紹介ページ(活用事例あり)

article-banner-umwelt

WRITING BY

TRYETING

公式

TRYETING公式です。
お知らせやIR情報などを発信します。