【スコアリングが5分でわかる！】予測スコアリングとリードスコアリング～その相違点と活用について～

顧客がある行動をとるか否かを事前に予測するといったシーンで活用される『予測スコアリング』というデータマイニングの手法があります。この予測スコアリングとマーケティングオートメーションにおける『リードスコアリング』を連携させることで、マーケティングオートメーションが、より効果的、効率的になる可能性があります。本記事では２つのスコアリングの考え方・手法・特長について解説します。

■第1章　データマイニングにおける『予測スコアリング』

マーケティングでは、二者択一で表される事象を扱うことが多々あります。例えば、

顧客が商品を購入するか否か
会員が退会するか否か

などです。

企業、そしてマーケッターには、このような二者択一の状況において顧客がどちらの行動をとるかを事前に予測して、施策（アクション）に反映させたいという要望があります。前述の事象では、

施策によって商品を購入する顧客を予測して、クーポンやダイレクトメールで優先的にアプローチしたい
（逆に）商品を購入する見込みのない顧客を予測して、アプローチしないことでコストを削減したい
退会しそうな会員を見い出して、適切なフォローアップを行いたい

などが要望として上がってきます。

このようなシーンで活用されるのが、データマイニングにおける『予測スコアリング（※１）』です。

※１：本記事では、データマイニングにおけるスコアリング分析を『予測スコアリング』、後述のマーケティングオートメーションにおけるリードスコアリングを『リードスコアリング』と呼び区別します。

『予測スコアリング』では、過去の実績を元に、未だ結果の判明していない顧客の未来を予測します。その際には、年齢・性別・職業といった顧客属性や、オンラインおよびオフラインでの行動履歴のデータが要因として用いられます。

分析手法としては、ロジスティック回帰分析が有名です。ロジスティック回帰分析は、重回帰分析と同様に多変量解析の手法のひとつで、重回帰分析が売上などの連続量を予測するのに対して、二者択一の事象を予測してスコアで表現するのが特長です。

前述の事象の場合、顧客属性と行動履歴を説明変数（要因）として、商品を購入するか否かの２値の目的変数を予測するロジスティック回帰分析を行うことになります。

■第2章　マーケティングオートメーション（MA）における『リードスコアリング』

マーケティングオートメーション（MA）においてもスコアリングと呼ばれる概念があります。

本記事でマーケティングオートメーション（MA）とは、「獲得した見込顧客（以下リード）を一元的に管理し、メールや自社コンテンツによってナーチャリングを実施して適切なタイミングで営業に渡す、というマーケティング活動を自動化する技術、ツール」のことを指しますが、その運用においては各リードに対して、

ナーチャリングの必要性を判断する
現状のナーチャリング状態を評価する
営業に渡すべきリードか否かを判断する

といった評価・判断が必要となります。

そのために活用されるのが『リードスコアリング』です。『リードスコアリング』とは、そのリードの「購入の見込度」あるいは「製品やサービス・ソリューションに対する関心の度合い」を評価するもの、とされ、その結果、スコアが低い、すなわち購入の見込度や関心の度合いが低いと評価されたリードに対してはナーチャリングを行い、スコアがある域値より高くなったリードを営業に渡すという運用を行います。

手法としては、デモグラフィック情報による属性スコアリングと、オンラインでの行動（例えば、自社サイトへのアクセス、メールの開封、メール内のリンクのクリック、など）による行動スコアリングの２軸で評価されることが一般的です。それぞれ、属性や行動の1つ1つに対してスコア値を設定し、それらの属性に該当もしくは行動をとったリードに対してスコア値を加点するという方法がとられます。

メールや自社コンテンツを用いてリードに行動を促し、それに反応したリードが行動を重ねるごとにスコアが上がるという積極的なアクションを前提としていることが特長的です。

ただし、属性や行動に紐づくスコア値はカスタマージャーニーなどを基にマーケッターが設定する必要があり、科学的な方法論が確立しているとは言い難い状況です。マーケティングオートメーションにおけるリードスコアリング活用の課題といえるでしょう。

■第3章　『予測スコアリング』と『リードスコアリング』の比較

『予測スコアリング』と『リードスコアリング』をいくつか観点で比較してみました。

	予測スコアリング	リードスコアリング
対象	顧客、法人などいろいろ	リード
目的	未来の予測	現状の評価
スコア	0から1の実数で予測確率を表す	0以上の整数で購買の見込みや関心の高さを表す
活用法	施策の優先順位（劣後順位）の基準とする	閾値を超えたら営業に渡す
手法	ロジスティック回帰など	マーケッターが設定したスコア値に従って加減する
BI/BA	BA的	BI的
要因	多変量的	単変量的
特徴	結果としてスコアの判断を基準と売る	介入によってスコアを上げることを目指す

特に顕著な違いは、

対象とする時間軸の違い
ビジネスアナリティクス（以下BA）とビジネスインテリジェンス（以下BI）の違い
単変量と多変量の違い

です。

1.対象とする時間軸の違い

『予測スコアリング』は、施策（アクション）の実施によって顧客が望ましい行動をとるか否かを事前に予測することを目的とするため、「未来」を対象としています。一方、リードスコアリングは各リードの現状（ステータス）を評価するものであり、時間軸としては「現在」を対象としています。

2.BAとBIの違い

時間軸の違いとも関連しますが、予測スコアリングは未来を予測するという意味でまさにBA志向です。一方、『リードスコアリング』は、リードの属性や過去の行動の積み上げで現状を測定しているため、BI志向、つまり、見える化に近いものとなります。（※２）

※２：これは「予測は見える化より優れている」という主張ではないことに注意してください。たとえ予測をする場合でも、まずは現状の見える化が必要なステップであり、見える化を行わない分析はナンセンスな結果を生み出しがちです。

3.単変量と多変量の違い

『予測スコアリング』で用いられるロジスティック回帰分析は多変量分析であり、その名のとおり、各要因の重み（回帰係数と呼ばれる）は、最小二乗法や最尤法といった統計的な手続きを経てデータに合わせて決めていきます。したがって、多数の要因が複雑に絡み合って最終的なスコアが算出されるため、人間には理解しがたい反面、定量的に正しい結果が得られる可能性が高いです。

リードスコアリングはひとつひとつの属性や行動に対応するスコア値を積み上げていくため単変量的です。なぜならば、異なる属性・行動に紐づくスコア値の相対的な関係は考慮されていないからです。したがって、あるリードに対してなぜそのスコアになったかは行動の履歴を振り返ることにより理解することができますが、定量的な正しさについては多変量解析に劣る可能性があります。

■第4章　マーケティングオートメーション（MA）における予測スコアリングの活用の可能性

では、すでに『リードスコアリング』を実施しているマーケティングオートメーション（以下MA）において予測スコアリングを活用するにはどのようにすればよいでしょうか。現時点では２つのアイデアがあります。

＜アイデア１＞スコアの併用

『予測スコアリング』でリードに優先順位（劣後順位）をつけ、その後のナーチャリングの状況を『リードスコアリング』でウォッチする。優先的にアプローチするリードをターゲティングして、適切なメールや自社コンテンツの作成が可能になります。

＜アイデア２＞『リードスコアリング』のスコア値の設定に回帰係数を活用する

予測スコアリングの回帰係数は各要因の重みを表すため、これを根拠にスコア値の設定を決めることが可能です。要因間の関係を取り込むことができるため、より定量的に正しいリードスコアリングが可能です。

前章で述べたとおり、『予測スコアリング』と『リードスコアリング』は観点が異なるため、どちらか一方を選択するものではないと考えます。

国内においても各企業のMAツール導入が進み、データとノウハウが蓄積されつつあります。今後は予測スコアリングの活用によって、さらに効果的なMAが実施できるのではないでしょうか。

【執筆者情報】
株式会社アイズファクトリー　取締役兼データサイエンス部長　筒井直人

2000年4月設立のソリューション提供型企業です。機械学習、テキストマイニング等の技術を用いてクライアント企業の課題解決をお手伝いしています。2011年8月には自動進化型クラウド解析プラットフォーム「bodais（ボダイス）」をリリース。最先端のデータサイエンス手法の研究開発にも取り組み続けています。

https://bodais.com/company/

【スコアリングが5分でわかる！】予測スコアリングとリードスコアリング～その相違点と活用について～

■第1章　データマイニングにおける『予測スコアリング』

■第2章　マーケティングオートメーション（MA）における『リードスコアリング』