MMMに企業独自の変数を入れるべきか? ― 判断基準・設計ポイント・他社事例
はじめに
マーケティングミックスモデリング(MMM)を構築する際、標準的な広告メディア変数だけでなく、自社固有の変数をモデルに組み込むべきかは、多くの実務家が直面する重要な論点です。
結論から言えば、適切な変数選定のもとで企業独自変数を取り入れることは、モデルの精度と実用性を大幅に向上させます。ただし、闇雲に変数を増やすと過学習やノイズの問題を招くため、明確な判断基準と設計方針が不可欠です。
本記事では、独自変数を「入れるべき場合」と「入れるべきでない場合」の判断基準、設計時の考慮ポイント、そして実際に独自変数を活用している企業の事例を解説します。
1. 企業独自変数とは何か
MMMの説明変数は大きく3つに分類できます。
標準的なメディア変数
- TV CM出稿量(GRP)、デジタル広告費、SNS広告インプレッション数など
- ほぼすべてのMMMで使用される基本変数
外部環境変数
- 季節性、祝日、天候、マクロ経済指標(GDP、失業率、消費者信頼感指数)
- 競合他社の広告活動やプロモーション
企業独自変数(カスタム変数)
- 価格戦略: SKU別平均価格、値引き率、競合との価格差
- 流通・配荷: 取扱店舗数、棚割り面積、EC チャネル比率
- 在庫・品揃え: SKU数、在庫切れ発生率
- ブランド指標: ブランド認知度、NPS、検索ボリューム
- 営業活動: 営業担当者数、店頭プロモーション回数
- 製品要因: 新商品投入、パッケージ変更、品質改善
これらの「企業独自変数」は、業種・業態・ビジネスモデルによって大きく異なり、自社の売上構造を正確に反映するために不可欠な要素となります。
2. 独自変数を入れるべき3つの理由
理由1: 施策効果の「純粋な」分離ができる
広告効果を正確に計測するには、広告以外の売上要因を統計的に分離する必要があります。たとえば、ある月の売上増加がTV CMによるものなのか、同時期に実施した店頭値引きによるものなのかを区別できなければ、広告ROIの算出は不正確になります。
企業独自変数を含めることで、交絡変数(Confounders)の影響を除去し、各施策の真の貢献度を明らかにできます。
理由2: 説明力の向上と予測精度の改善
メディア変数だけでは売上変動の一部しか説明できません。特にBtoBやサービス業では、営業活動や価格戦略が売上の大部分を左右します。
独自変数を追加することで、モデルの説明力(R²)が向上し、残差に含まれていたシグナルを適切に捉えられるようになります。
理由3: アクショナブルなインサイトの創出
「広告費を増やせ」だけでなく、「価格弾力性がこの水準なので、10%の値下げで売上X%増が見込める」「配荷率を5ポイント上げれば、広告効率も連動して改善する」といった、経営判断に直結するインサイトが得られます。
3. 変数を追加する際の5つの考慮ポイント
ポイント1: 仮説ドリブンで変数を選定する
変数選定は「手元にあるデータを全部入れる」のではなく、「この変数は売上にどのようなメカニズムで影響するか」という仮説に基づいて行います。
Google Meridianの公式ドキュメントでも、「予測精度の向上ではなく、因果推論の精度向上を目的として変数を選ぶべき」と明記されています。具体的には、**マーケティング施策の意思決定に影響を与え、かつ売上にも影響する変数(交絡変数)**を優先的に含めるべきです。
ポイント2: データ量と変数数のバランス
時系列データは一般的にサンプル数を増やしにくいため、変数の追加には慎重さが求められます。
Meta社のRobynでは、データ行数(n)が変数数(p)の7〜10倍以上であることを推奨しています。たとえば週次データ3年分(約156週)であれば、説明変数は15〜22個が上限の目安です。
ポイント3: 多重共線性の確認
価格と値引き率、TV GRPとTV広告費のように、**相関が高い変数を同時に投入すると多重共線性(Multicollinearity)**が生じ、係数の推定が不安定になります。
VIF(分散拡大要因)を確認し、VIF > 10の変数ペアがあれば、どちらか一方を除外するか、主成分分析で統合することを検討します。Robynではリッジ回帰を採用しているため多重共線性に一定の耐性がありますが、解釈性を重視する場合は事前の対処が重要です。
ポイント4: 変数の変換処理を適切に行う
企業独自変数のうち、広告と同様に「残存効果(アドストック)」や「飽和効果(サチュレーション)」を持つものがあります。
- 残存効果がある変数: ブランド認知度調査スコア、SNSの口コミ件数など → アドストック変換が有効
- 飽和効果がある変数: 営業訪問回数、店頭プロモーション回数など → 対数変換やヒル関数での変換が有効
- 線形で効く変数: 価格、配荷率、気温など → 変換不要でそのまま投入
Robynでは organic_vars に指定した変数にはアドストック・飽和変換が自動適用され、context_vars に指定した変数はそのまま線形で投入されます。変数の性質に応じた適切な分類が重要です。
ポイント5: 段階的にモデルを構築する
いきなり全変数を投入するのではなく、以下のステップで段階的に構築します。
- ベースモデル: トレンド + 季節性 + 主要メディア変数
- 拡張モデル: + 価格・流通などの主要独自変数
- 最終モデル: + 競合データ・ブランド指標などの補助変数
各段階でモデル適合度と係数の安定性を確認し、ビジネス的に妥当な結果かどうかを検証します。
4. 企業独自変数を活用した他社事例
事例1: HelloFresh ― ファネル変数と時変効果の導入
業種: 食材宅配サービス(DtoC) 独自変数: マーケティングファネルの中間変数、COVID影響の時変係数
HelloFreshは、年間数億ドル規模のマーケティング予算を最適化するため、PyMC3を用いたベイジアンMMMを自社開発しました。
特筆すべきは2段階ファネルモデルのアプローチです。第1段階で上流チャネル(TV、ブランド広告)のみをモデリングし、第2段階でそれらが下流チャネル(検索広告、アフィリエイト)にどれだけ波及しているかを定量化しました。
さらに、COVID-19の影響でチャネル別のパフォーマンスが時間とともに大きく変化したため、時変係数(Time-Varying Effects) を導入。特定のデジタルチャネルが急激に高騰した時期と、逆に安価になった時期の効果差を正確に捉えることに成功しました。
また、リフトテストや増分テストの結果をベイジアンモデルの事前分布として組み込むことで、外部検証との整合性を保ちながらモデルの信頼性を高めています。
参考: Bayesian Media Mix Modeling using PyMC3, for Fun and Profit - HelloFresh Engineering Blog / Reducing Customer Acquisition Costs: How PyMC Labs Helped Optimize HelloFresh's Marketing Budget
事例2: L'Oreal ― EC販売チャネルとブランド指標の分離モデル
業種: 化粧品(グローバルCPG) 独自変数: EC販売データ(Amazon・自社EC)、ブランド認知度、市場別消費者行動
L'Oreal は、MMMを戦略レベルとオペレーションレベルの両方で活用しています。
北欧市場(デンマーク・スウェーデン)での実装では、実店舗小売とEC(Amazon等のピュアプレイヤー含む)を別モデルとして分離し、チャネルごとの広告効果を個別に評価しました。これにより、コネクテッドTV(CTV)が通常のスクリーン広告よりROIが30〜50%高いことを発見しています。
さらに、市場ごとの消費者行動の違い(価格感応度、季節性パターン)を変数として取り込み、デンマークとスウェーデンで異なるメディア最適配分を導き出しました。
L'Oreal は「MMMは万能ではなく、戦略的な方向性を示すツールの一つとして、他の測定手法と組み合わせて使うべき」と述べています。
参考: The beauty behind L'Oreal's marketing mix modelling to drive Nordic growth - Think with Google / L'Oreal on the keys to success for marketing mix modelling - WARC
事例3: Beyond Meat ― 小売チャネル別・販売網変数の統合
業種: 植物性食品(CPG) 独自変数: 小売チャネル別売上(Costco、Walmart、専門店)、販売網構成
Beyond MeatのMMMでは、Big Box(Costco)、従来型スーパー(Walmart)、専門ヘルスフード店など、小売チャネル別の売上データを独自変数として投入しました。
分析の結果、メディア投資が売上全体の約10%をインクリメンタルに生み出しており、ROAS は約4.0ドルであることが判明。さらに、メディアの種類によって効果が異なる販売チャネルがあることを発見し、チャネル別のメディア最適化戦略を構築しました。
メディア予算をほぼ倍増させた場合、小売売上の26%成長が見込めるという予測シナリオも提示しています。
参考: Marketing Mix Modeling - A Modern Case Study (Beyond Meat) - M-Squared
事例4: Nexon ― イベント変数と外部環境の組み込み
業種: ゲーム 独自変数: リブランディング効果、スポーツイベント(アジアカップ等)、ゲーム内イベント
ゲーム企業Nexonは、YouTube広告、パフォーマンス広告、デジタル屋外広告(DOOH)など多様なメディアミックスを使用しています。
リブランディングやアジアカップなどのスポーツイベントといった動的な外部要因がメディア効果に与える影響を独自変数として組み込み、Google Meridianを用いてインクリメンタルROASを測定しました。
参考: MMM case study: Data-driven marketing - Think with Google APAC / Google Meridian MMM Success Story - Analytica House
事例5: 日本の大手食品メーカー ― 店頭プロモーション・価格変数
業種: 食品・飲料(国内CPG) 独自変数: 店頭プロモーション施策、SKU別価格設定、Web動画広告のターゲティングデータ
日本国内の大手食品メーカーは、長年TV CMに多額の予算を投じていたものの、その効果を正確に把握できていませんでした。
MMMを導入し、TV CM・Web広告・店頭プロモーション・価格設定などあらゆる要因を変数として統合分析した結果、ゴールデンタイムのTV CMよりも、特定ターゲット層向けのWeb動画広告の方がROIがはるかに高いことが判明。
予算再配分により、総広告費を10%削減しながら売上は前年比5%向上を達成しました。
参考: MMM(マーケティングミックスモデリング)とは?分析手法からツールに事例まで解説 - kiyono / MMM(マーケティング・ミックス・モデリング)とは?活用事例を含めて解説 - Fabeee
5. 独自変数を「入れるべきでない」ケース
すべての企業が独自変数を追加すべきというわけではありません。以下のケースでは、標準的なモデルから始めることを推奨します。
- データ量が少ない場合: 週次データ1年分(52週)しかない場合、変数は5〜7個が限界。まずメディア変数と季節性で基礎モデルを構築すべき
- 変数の取得コストが高い場合: 競合の広告出稿データや配荷率データの購入・取得コストがモデル改善効果に見合わない場合
- 変数の変動が小さい場合: 分析期間中にほぼ変化しない変数(例: 3年間ずっと同じ価格帯)は、統計的に効果を推定できない
- 因果の方向が不明確な場合: 売上が増えたから配荷率が上がったのか、配荷率が上がったから売上が増えたのか、逆因果の可能性がある変数は慎重な扱いが必要
6. 実装に使えるオープンソースツール
| ツール | 開発元 | 独自変数の扱い |
|---|---|---|
| Robyn | Meta | context_vars(線形)、organic_vars(アドストック+飽和変換) |
| Meridian | Control Variables として投入。因果推論の観点から交絡変数を優先 | |
| PyMC-Marketing | PyMC Labs | 完全にカスタマイズ可能。任意の事前分布と変換関数を設定可能 |
| LightweightMMM | Extra Features として追加。販売数+15%、CV+20%の改善事例あり |
まとめ
MMMに企業独自の変数を組み込むことは、モデルの精度と実用性を向上させる有効なアプローチです。ただし、成功のためには以下の原則を守ることが重要です。
- 仮説ドリブン: 「なぜこの変数が売上に影響するか」を説明できる変数のみを投入する
- データ量とのバランス: 変数数はデータ行数の1/7〜1/10以下に抑える
- 段階的構築: ベースモデルから始めて、変数を段階的に追加する
- ビジネス検証: 統計的に有意でも、ビジネス的に妥当でなければ再検討する
- 継続的改善: 一度構築したら終わりではなく、新しいデータと知見でモデルを更新し続ける
「自社オリジナル」のMMMモデルこそが、最も強力な競争優位になります。標準的なモデルに留まらず、自社のビジネス構造を反映した変数設計に挑戦してみてください。