こんにちは、DXCEL WAVEの運営者(@dxcelwave)です!
- アソシエーション分析とバスケット分析の概要・違い・活用法
- アソシエーション分析の評価指標(Support, Confidence, Lift)
- アソシエーション分析とレコメンド機能の位置付け
アソシエーション分析とは
アソシエーション分析とは、大量のデータから「もしAであれば、Bであろう」という有効な傾向をアソシエーション・ルールとして取り出し、マーケティング等のあらゆるビジネス領域に応用するデータマイニング手法です。
アソシエーション分析の目的は、アソシエーション・ルールという「ある事象が発生すると別の事象が一緒に発生するという、事象間で強い関係性」を見出すことです。
レストランでの注文結果を例に考えた際、アソシエーション分析によって「チーズとパスタを注文する顧客は、高確率でワインも注文する」ことが分かったとします。
この時アソシエーション・ルールは、「チーズ&パスタ注文(対象事象)が発生した際、ワイン注文(別事象)が発生する確率が高い」となります。そしてこのルールは、レストランのメニュー表でチーズとパスタと同じページにおすすめワインを掲載したり、チーズとパスタを注文した顧客に直接ワインをおすすめしたりなど、売上向上に際したビジネス用途に展開できます。
このように「もし○○○ならば△△△である」という高確率で発生する規則性を抽出し、ビジネス現場に応用できることこそアソシエーション分析の価値と言えますね。
アソシエーション分析の活用例
アソシエーション分析は、対象事象が行動記録である全ての事象に対して適用できます。例えば、次のような現場での活用が期待できます。
商品販売:商品売上の向上
ECサイトやショッピングセンターのPOSデータをもとに、顧客がどのような商品の組み合わせで購入する傾向にあるか分析。その結果を商品のレコメンドやプロモーション活動に展開し売上向上を狙う。
Webサイト:問い合わせ件数の増加
例えば、マンションの不動産サイト運営に際して、サイト訪問者が同時に見るマンションページの組み合わせを分析。その結果を関連ページとして優先的にサイト表示する仕組みを構築し、マンションの下見・契約に関する問い合わせ数増加を狙う。
対象事象の異常検知
医療電場では、病院での健康診断の結果をもとに、患者の症状を分析。その結果から新たに発生しやすい疾患を予測し、患者に対して事前予防を促す。
自動車などの製造現場では、エンジンや自動車部品の劣化情報を分析。故障しやすくなる条件を抽出し、故障予防の知見として役立てる。
バスケット分析(併売分析)とは|アソシエーション分析との違い
バスケット分析とは、POSデータ等から顧客の購買履歴を調査し、高頻度で一緒に買われる商品の組み合わせを見つけ出すためのデータマイニング手法です。また、アソシエーション分析の手法のひとつがバスケット分析という位置付けです。さらに、バスケット分析はPOSデータの分析手法の1つとして発展した手法でもあり、関係性は上図で表されます。
アソシエーション分析とバスケット分析の大きな違いは、対象事象が指す行動履歴にあります。バスケット分析の場合「商品購入」を対象事象として指定するのが特徴です。一方で、アソシエーション分析は「商品購入」だけでなく「Webサイト訪問」「問い合わせ」など様々な顧客の行動履歴が対象事象になり得えます。
単に指定する対象事象の範囲が異なるだけであり、分析目的はアソシエーション分析・バスケット分析ともに同じであるため、そこまで違いを意識する必要はないでしょう。
バスケット分析|マーケティング応用事例
バスケット分析の結果は、商品の仕入れ在庫数や、販売店舗におけるレイアウトの棚割、併用販売キャンペーン実施にあたるセット商品の選定など、これらを決定するために用いられます。
例えば「週末や祝日にかけてチーズとパスタを注文する顧客はワインも一緒に注文する」ことが分析により分かったとします。その場合、週末キャンペーンと題して、チーズ・パスタ・ワインのセットメニューを販売する特売施策を打つのが有効的でしょう。
また、顧客属性と時系列分析結果をバスケット分析結果に応用すると「20代のカップルは、クリスマス期間にワインをまとめて購入する」といった時間×顧客属性軸での購買傾向も洞察できるようになります。
アソシエーション分析で用いる代表的な評価指標
アソシエーション分析において、アソシエーション・ルールを決定する代表的な評価指標として次のようなものがあります。
- 支持度(Support)
- 期待信頼度(Expected Confidence)
- 信頼度(Confidence)
- リフト値(Lift)
支持度(Support)
全体の中で、該当の商品組み合わせが占める割合を支持度(Support)と呼びます。
例えば、100件の購買データのうち、60件が「商品Aと商品Bを一緒に購入したデータ」の場合、
支持度 = 60/100 = 0.6です。
支持度が高いと「商品Aを購入すると商品Bも購入する顧客数が多い」と判断できます。反対に支持度が低いと、その事象が指す顧客数は少ないことになるため、一般性な事象では無いと判断できます。
期待信頼度(Expected Confidence)
全体の中で、商品Bが購入される確率を期待信頼度(Expected Confidence)と呼びます。
期待信頼度が高いほど、商品Bを購入する顧客が多いことを意味しています。
信頼度(Confidence)
商品Aが購入されたデータの中で、商品Bも購入される確率を信頼度(Confidence)と呼びます。
商品Aを購入した顧客が60人いた場合、その中で商品Bも買ったことのある顧客が30人いたとします。
この時、信頼度 = 30/60 = 0.5 です。
支持度が低く信頼度が高い場合、「商品Aを購入する顧客は、ほとんどの確率で商品Bも一緒に購入する」ことになります。
信頼度と支持度どちらも高い場合、「大半の顧客が商品Aも商品Bも購入している」ことを意味するため、商品Aと商品Bの率先したクロスセル施策は、マーケティング上そこまで重要ではないと判断できます。
支持度が高く信頼度が低い場合、「商品Aを購入した大半の顧客は、商品Bを購入しない」ことになります。この場合の解釈は2通りあり、「これまで商品Aと商品Bのプロモーション施策ができていなかったのが問題だ。商品Bを併売してもらうようプロモーション施策を打てば、商品Aを購入した顧客は商品Bも購入するようになるだろう」と判断するのか、「商品Aと商品Bはそもそも全く関連しない商品である。そのため、併売販売は向いていない」と判断するかです。
上記のようなケースに遭遇した際、さらに深く解釈する方法として後述するリフト値があります。
リフト値(Lift)|信頼度を証明する手法
リフト値は、商品Aと一緒に商品Bも購入した顧客(信頼度)は、商品Bを購入した全ての顧客(期待信頼度)の中でどれだけの割合存在するのかを示したものです。
つまり、リフト値=信頼度/期待信頼度
として表せます。
リフト値が低い場合、「商品Bが単独で購入されている」ことを意味します。この場合、たとえ信頼度が高い値を示しても、商品Aと商品Bの繋がりは小さいと判断できてしまいます。
リフト値が高い場合、「商品Aを購入した顧客は商品Bも高確率で購入する」ことを意味します。
具体的なリフト値の判断基準は以下に示します。
Lift値 | 解釈例 | 商品AとBの関連性 |
---|---|---|
Lift < 1.0 | 商品Aが購入されていると、通常よりも商品Bは購入されない傾向あり。 | 低 |
Lift = 1.0 | 商品Aが購入有無に問わず、商品Bは同じ確率で購入される。 | 中 |
Lift > 1.0 | 商品Aが購入されると、商品Bの購入される傾向あり。 | 大 |
Lift > 3.0 | 商品Aが購入されると、商品Bの購入確率が3倍以上になる。 | 極大 |
アソシエーション分析では、支持度、信頼度、リフト値を総合して評価することを推奨します。
協調フィルタリング|アソシエーション分析結果を商品レコメンド手法に応用
私たちがECサイトで買い物する時や、YouTube・Netflixなどで動画を視聴する際、よく商品やコンテンツを「おすすめ」されますね。この「おすすめ」にはレコメンデーションという機械学習技術が使われており、その機械学習技術を構築するためにアソシエーション分析結果が参考にされています。
レコメンデーション
「商品Aを購入したお客様は、こちら商品Bも一緒にお買い上げいただいています」「あなたにおすすめの動画はこちら」という表記を目にすることでしょう。
顧客におすすめ商品やサービスの情報を提供することをレコメンデーションと呼びます。また、おすすめ商品やサービスを提供する機能をレコメンド機能と呼びます。
レコメンド機能をマーケティング領域でうまく活用できると、さらなる商品の売上向上が期待できます。
売上向上施策と題してレコメンド機能を検討する際、重要なのは「顧客に合った商品やサービスを精度よくレコメンドできること」です。
レコメンド機能の精度を高めるための有効手段の1つがアソシエーション分析です。アソシエーション分析によって商品同士の強い繋がりを抽出し、レコメンド機能に適用することで、レコメンデーションの全体の精度向上が期待できます。
協調フィルタリング
レコメンド機能の多くには、協調フィルタリングという仕組みが採用されており、協調フィルタリングの代表的な仕組みとして「アイテムベース」「ユーザーベース」があります。
協調フィルタリングとは、顧客の商品購入・閲覧履歴をもとに、商品をおすすめする仕組みです。おすすめする方法によっていくつか種類が分けられます。
協調フィルタリング | 概要 |
---|---|
ユーザーベース | 対象顧客と似ている顧客が買った商品・サービスをレコメンドする |
アイテムベース | 現在閲覧されている商品・サービスと似ているものをレコメンドする |
補足として、Amazonはアイテムベースの協調フィルタリングを採用していることで有名です。
【アソシエーション分析体験】Pythonによるバスケット分析
最後にPythonを用いてバスケット分析を体験できる記事をご紹介します。バスケット分析を実行するための代表的なアルゴリズムとしてAprioriやEclat、FP Growthなどがあります。
Python×Aprioriによるバスケット分析
【Python×Apriori】アソシエーション・バスケット分析実践法|マーケティングレコメンド手法への応用支援
Python環境でのアソシエーション分析・レコメンド機能の作成に興味がある方向けに、Aprioriアルゴリズムを採用したアソシエーション分析手法を解説します。
Python×Eclatによるバスケット分析
【Python×Eclat】アソシエーション・バスケット分析によるマーケティング高度化支援
Pythonでアソシエーション分析を実践したい方向けに「Eclatを採用したアソシエーション分析モデルの作成方法」を詳しく解説します。
最後に
お問い合わせフォーム
上記課題に向けてご気軽にご相談下さい。
お問い合わせはこちら