回帰分析の基礎：MMMの統計的バックボーンを理解する

はじめに

回帰分析は、マーケティングミックスモデリング（MMM）の統計的な土台です。MMMとは、突き詰めれば「売上を目的変数、広告費や外部要因を説明変数とする回帰モデル」にほかなりません。

本記事では、回帰分析の基礎からMMMへの応用まで、統計の初学者にも理解しやすいよう具体的な数値例を交えて解説します。数式の意味を直感的に理解することを重視し、MMMの結果を正しく読み解くための統計リテラシーを養います。

単回帰と重回帰の違い

単回帰分析

単回帰分析は、1つの説明変数で目的変数を説明するモデルです。

モデル式：売上 = α + β × テレビCM費 + ε

例えば、過去12ヶ月のテレビCM費と売上のデータが以下だとします。

月	テレビCM費（万円）	売上（万円）
1月	500	8,200
2月	300	7,100
3月	700	9,500
4月	400	7,800
5月	600	8,900
6月	200	6,500

このデータに単回帰を当てはめると、例えば以下のような結果が得られます。

切片（α）= 5,500万円
傾き（β）= 5.5

これは「テレビCM費0万円でもベース売上は5,500万円あり、テレビCM費1万円の増加で売上が5.5万円増える」と解釈できます。

重回帰分析

重回帰分析は、複数の説明変数で目的変数を説明するモデルです。MMMは本質的に重回帰モデルです。

モデル式：売上 = α + β₁ × テレビCM費 + β₂ × デジタル広告費 + β₃ × 季節ダミー + ε

月	テレビCM費	デジタル広告費	季節ダミー	売上
1月	500	200	0	8,200
3月	700	350	0	9,500
7月	400	300	1	9,800
12月	800	500	1	13,200

重回帰の結果例：

α = 4,000万円（ベース売上）
β₁ = 4.2（テレビCM費の係数）
β₂ = 6.8（デジタル広告費の係数）
β₃ = 1,500万円（夏・年末の季節効果）

重回帰では、他の変数を一定に保ったときの各変数の効果が推定されます。これがMMMの核心であり、「テレビCMの効果をデジタル広告や季節性を除外して推定する」ことを可能にします。

MMMにおける目的変数と説明変数

目的変数（従属変数）

MMMの目的変数は、ビジネスのKPIとなる指標です。

目的変数の例	適用場面
売上高（金額）	最も一般的
販売数量	価格変動の影響を分離したい場合
コンバージョン数	EC・SaaS等
新規顧客数	顧客獲得フォーカスの場合
ブランド認知率	ブランディング効果測定の場合

説明変数（独立変数）

MMMの説明変数は大きく3つのカテゴリに分類されます。

1. マーケティング変数（コントロール可能）

テレビCM費（またはGRP）
デジタル広告費（チャネル別）
プロモーション活動（値引き率、クーポン等）
PR・イベント活動費

2. 外部環境変数（コントロール不可能）

季節性（月ダミー、フーリエ変換）
祝日・イベント
天候（気温、降水量）
経済指標
競合活動

3. トレンド変数

長期的な成長・衰退トレンド
構造変化（コロナ前後など）

回帰係数の解釈

基本的な解釈

回帰係数βは「他の変数を一定としたとき、説明変数が1単位増加した場合の目的変数の変化量」を表します。

具体例で理解する

MMMの結果として以下の係数が得られたとします。

変数	係数	単位	解釈
テレビCM費	4.2	万円/万円	テレビCM費1万円増 → 売上4.2万円増
デジタル広告費	6.8	万円/万円	デジタル広告費1万円増 → 売上6.8万円増
気温	-15.0	万円/℃	気温1℃上昇 → 売上15万円減（暖房器具等）
祝日ダミー	800.0	万円	祝日週は売上が800万円増

注意点

係数の大きさだけで効果を比較してはいけません。変数のスケール（単位）が異なるためです
標準化係数（各変数を標準偏差で割った係数）を使えば、変数間の相対的な影響度を比較できます
MMMでは通常、Adstock変換や飽和変換を施した後の係数なので、「生の広告費1万円あたり」とは直接対応しない場合があります

対数変換（log-log、semi-log）の意味

MMMでは、変数を対数変換して使うことが一般的です。変換の種類と意味を理解しましょう。

log-logモデル

log(売上) = α + β × log(広告費) + ε

このモデルでは、係数βは**弾力性（Elasticity）**を表します。「広告費が1%増えると、売上がβ%増える」という解釈になります。

弾力性（β）	意味
β = 0.1	広告費1%増 → 売上0.1%増
β = 0.5	広告費1%増 → 売上0.5%増
β = 1.0	広告費1%増 → 売上1.0%増（比例）

log-logモデルは、自動的に収穫逓減を表現できる利点があります。β < 1 であれば、広告費を2倍にしても売上は2倍にはなりません。

数値例

広告費が1,000万円で売上が1億円、βが0.3の場合：

広告費を10%増やす（1,000万 → 1,100万円）と
売上は 0.3 × 10% = 3% 増加（1億 → 1億300万円）

semi-logモデル（log-lin）

log(売上) = α + β × 広告費 + ε

係数βは「広告費が1単位増えると、売上がβ × 100 %増える」という解釈です。

lin-logモデル

売上 = α + β × log(広告費) + ε

係数βは「広告費が1%増えると、売上がβ/100単位増える」という解釈です。

MMMでの使い分け

モデル	数式	使用場面
lin-lin	売上 = α + β × 広告費	線形効果を仮定（あまり現実的でない）
log-log	log(売上) = α + β × log(広告費)	弾力性の推定、収穫逓減を仮定
semi-log	log(売上) = α + β × 広告費	広告費の一定額増加の効果を測定
lin-log	売上 = α + β × log(広告費)	広告費の「割合」増加の効果を測定

モダンなベイズMMMツールでは、対数変換の代わりに飽和関数（Hill関数等）を使って収穫逓減をモデル化することが主流になっています。

R²（決定係数）の意味と注意点

R²とは

R²（R-squared、決定係数）は、モデルがデータの変動をどの程度説明できているかを0〜1の値で示します。

R² = 0.85 → モデルが売上変動の85%を説明している
R² = 0.60 → モデルが売上変動の60%を説明している

MMMにおけるR²の目安

R²の範囲	一般的な評価
0.90以上	非常に高い（過学習の可能性も確認）
0.80〜0.90	良好
0.70〜0.80	許容範囲
0.70未満	改善の余地あり

R²の注意点

R²は変数を増やせば必ず上がります。 無関係な変数を追加しても上がるため、変数追加の指標としてはR²ではなく**調整済みR²（Adjusted R²）**を使いましょう。

R²が高くても因果関係の証明にはなりません。 見せかけの相関でもR²は高くなり得ます。

時系列データではR²が高くなりやすいです。 MMMで扱う売上データはトレンドや季節性があるため、それだけでR²が高くなります。モデルの良し悪しの判断は、R²単体ではなく、残差分析やホールドアウト検証と組み合わせて行いましょう。

残差分析の基礎

残差とは

残差（Residual）= 実際の値 − モデルの予測値

残差を分析することで、モデルが捉えきれていないパターンや問題点を発見できます。

チェックすべき3つのポイント

1. 残差のランダム性

残差が時間軸に沿ってランダムに散らばっていれば良好です。パターン（例：連続して正の残差が続く）が見られる場合、モデルが何らかの構造を捉え損ねています。

2. 残差の正規性

残差がおおよそ正規分布に従っているかを確認します。Q-Qプロットやヒストグラムで視覚的に確認できます。大きく外れる場合、外れ値の影響や変数変換の必要性を示唆します。

3. 等分散性（Homoscedasticity）

予測値の大きさによらず、残差のばらつきが一定であるべきです。売上が大きい月ほど残差が大きい場合、対数変換が有効なことを示します。

MMMにおける残差分析の実践

残差に特定の時期に偏りがあれば、以下を検討します。

残差パターン	考えられる原因	対応策
年末に大きな正の残差	年末商戦の効果がモデルに不足	年末ダミー変数の追加
周期的なパターン	季節性の捉え方が不十分	フーリエ変換の次数を調整
特定月に大きな外れ値	特殊イベント（コロナ等）	ダミー変数で対応
徐々に残差が大きくなる	トレンドの変化	トレンド変数の追加

一般化線形モデル（GLM）への拡張

なぜGLMが必要か

通常の線形回帰は、目的変数が連続的で正規分布に従うことを仮定しています。しかし、MMMの目的変数が以下のような場合、この仮定が成り立たないことがあります。

目的変数の性質	適切なGLM	リンク関数
正の連続値（売上等）	ガンマ回帰	対数リンク
カウントデータ（注文数等）	ポアソン回帰	対数リンク
割合データ（CVR等）	ロジスティック回帰	ロジットリンク

GLMを使うことで、目的変数の特性に合ったモデリングが可能になり、予測精度と解釈性が向上します。

なぜベイズ回帰がMMMに適しているか

ベイズ回帰の基本的な考え方

従来の回帰分析（頻度主義）では、データのみからパラメータの「1つの最良推定値」を求めます。一方、ベイズ回帰では、事前知識（事前分布）とデータの情報を組み合わせて、パラメータの確率分布（事後分布）を推定します。

MMMにベイズが適している5つの理由

1. 事前知識の活用

「広告効果はマイナスにはならない」「テレビCMの弾力性は通常0.01〜0.3の範囲」といった業界知識を事前分布として組み込めます。

2. 不確実性の自然な定量化

各パラメータの事後分布から、推定値の信用区間を直接得られます。「テレビCMのROIは90%の確率で1.5〜3.0の間」といった確率的な表現が可能です。

3. 小サンプルへの対応

MMMのデータは週次で2〜3年分（100〜150点）と、統計モデルとしてはデータが少ない部類です。事前分布がデータ不足を補い、安定した推定を実現します。

4. 複雑なモデル構造への対応

Adstockのdecay率や飽和関数のパラメータを他のパラメータと同時に推定するなど、階層的で複雑なモデルも柔軟に扱えます。

5. 正則化の自然な実現

事前分布は自動的に正則化（過学習の防止）として機能し、係数が極端な値になることを防ぎます。

頻度主義 vs ベイズの比較まとめ

特徴	頻度主義回帰	ベイズ回帰
パラメータ推定	点推定（1つの値）	分布推定（確率分布）
事前知識の活用	困難	事前分布で自然に組み込み可能
不確実性の表現	信頼区間（解釈に注意が必要）	信用区間（直感的に理解しやすい）
小サンプルへの耐性	弱い	事前分布が補完し、比較的強い
計算コスト	低い	高い（MCMCサンプリング等）
代表的ツール	R (lm), Python (statsmodels)	PyMC, Stan, Robyn

まとめ

本記事で扱った回帰分析の基礎知識は、MMMの結果を正しく理解するための必須スキルです。

単回帰と重回帰：MMMは複数チャネルの効果を同時推定する重回帰モデル
回帰係数：「他の条件が同じとき、1単位の変化がもたらす効果」と解釈
対数変換：弾力性の推定と収穫逓減の表現に活用
R²：モデルの説明力を示すが、万能ではない
残差分析：モデル改善のヒントを見つける重要なステップ
ベイズ回帰：事前知識の活用、不確実性の定量化など、MMMに最適な特性を持つ

次のステップとして、実際のMMMツール（PyMC-Marketing、Robyn等）を触りながら、本記事の知識を実践に結びつけてみてください。