MMM基礎知識8分で読める

MMMで使うデータの種類と収集方法

この記事の目次
  1. MMMに必要なデータを理解する

MMMに必要なデータを理解する

MMMに必要なデータは、目的変数(売上・CV数などのKPI)、マーケティング変数(チャネル別広告費・GRP・インプレッション数)、コントロール変数(季節性・祝日・天候・競合活動)の3カテゴリに分類されます。推奨データ量は最低2年分(104週分)の週次データで、チャネル数は8〜12が目安です。日次データが利用できればより詳細な分析が可能ですが、月次データでは季節性やキャンペーン効果の分離精度が低下します。実務ではプロジェクト工数の50〜70%がデータ収集・前処理に費やされるため、事前のデータ棚卸しが成功の鍵です。MixCastでは、日付列・売上列・各チャネル広告費列を含むCSVをアップロードするだけで、データ前処理からベイジアンMMM分析まで自動で実行されます。

MMMに必要なデータの3つのカテゴリ

MMMで使用するデータは、大きく3つのカテゴリに分類されます。

1. 目的変数(KPIデータ)

分析の対象となるビジネスKPIです。何を最適化したいかによって選択します。

  • 売上金額:最も一般的な目的変数。B2C企業ではPOSデータ、ECではGMVが使われます。
  • コンバージョン数:問い合わせ数、資料請求数、会員登録数など。B2B企業やリード獲得型のビジネスで使用。
  • 来店客数:小売業やサービス業で使われることがあります。
  • アプリインストール数:アプリビジネスにおけるKPI。

目的変数は日次または週次の粒度で収集するのが一般的です。月次データでは季節性やキャンペーン効果を正確に捉えることが難しくなります。

2. マーケティング変数(広告費データ)

各マーケティングチャネルへの投資額や活動量を示すデータです。チャネルごとに適切な指標を選択する必要があります。

  • テレビCM:GRP(Gross Rating Point)または広告費。GRPはリーチの代理変数として優れていますが、入手が難しい場合は広告費でも代用可能です。
  • デジタル広告(リスティング):広告費、クリック数、インプレッション数。Google Ads、Yahoo!広告のレポートから取得します。
  • ディスプレイ広告:広告費、インプレッション数。GDN、YDAなどのプラットフォームから取得。
  • SNS広告:Facebook/Instagram広告費、X(旧Twitter)広告費、LINE広告費。各プラットフォームの管理画面からエクスポートします。
  • 動画広告:YouTube広告費、視聴回数。Google Ads管理画面から取得可能です。
  • アフィリエイト:報酬金額、クリック数。ASPの管理画面からダウンロード。
  • メールマーケティング:配信数、開封数。MAツールからエクスポート。
  • プロモーション:値引き率、クーポン配布数、セール実施フラグ。

3. コントロール変数(外部要因データ)

マーケティング活動以外で売上に影響を与える要因です。これらを適切にモデルに組み込むことで、マーケティング変数の効果をより正確に推定できます。

  • 季節性:月、曜日、四半期などの時間的パターン。多くのビジネスで売上には明確な季節性があります。
  • 祝日・大型連休:GW、お盆、年末年始、ブラックフライデーなど。業種によってプラスにもマイナスにも影響します。
  • 天候:気温、降水量。飲料、アパレル、レジャーなどの業種で特に影響が大きいです。気象庁のオープンデータから取得可能。
  • 経済指標:消費者物価指数、消費者信頼感指数。長期的な売上トレンドに影響する場合があります。
  • 競合活動:競合他社の大規模キャンペーンやテレビCM出稿。入手が難しい場合はダミー変数で表現。
  • 自社イベント:新商品発売、店舗リニューアル、システム障害など。

データの期間と粒度

MMMの精度を確保するために必要なデータの量と粒度について、実務的なガイドラインを示します。

  • 推奨期間:最低2年分(104週分)。理想的には3年分以上。季節性を正確に捉えるためには、少なくとも2サイクル分のデータが必要です。
  • 推奨粒度:週次が最も一般的です。日次データが利用可能であれば、より詳細な分析が可能ですが、ノイズも増えるため注意が必要です。
  • チャネル数の目安:データポイント数に対してチャネル数が多すぎると過学習のリスクがあります。週次2年分(104ポイント)の場合、8〜12チャネル程度が目安です。

データ収集でよくある課題と対策

  • データのサイロ化:各チャネルのデータが異なる部署やツールに散在している問題。プロジェクト開始前にデータオーナーを特定し、収集プロセスを標準化しましょう。
  • 粒度の不一致:テレビは月次、デジタルは日次など、チャネルごとにデータ粒度が異なることがあります。最も粗い粒度に合わせるか、適切な方法で按分する必要があります。
  • 欠損データ:特定の期間のデータが欠損していることは珍しくありません。補完方法としては、線形補間、前後の平均値、あるいは0埋めなどがありますが、欠損の理由を考慮して適切な方法を選択します。

効率的にデータを準備するために

MixCastでは、シンプルなCSV形式でデータをアップロードするだけでMMMを実行できます。日付列、売上列、各チャネルの広告費列を含むCSVを準備するだけで、データの前処理やモデル構築は自動で行われます。まずは手元にあるデータで試してみて、必要に応じてデータを追加・改善していくアプローチがおすすめです。

MixCastで広告予算を最適化しませんか?

CSVをアップロードするだけで、AIがチャネル別ROIと最適予算配分を算出。無料プランあり。

無料で始める