データ分析Basic

MMMのデータ準備：変数の正規化・標準化の実践ガイド

TV広告費5000万円 vs メール費10万円──スケールの異なる変数を正しく処理しないとMCMCが不安定になります。実践的な正規化・標準化の手法を解説します。

MMM Lab 編集部2026/2/233分で読める6

なぜスケール調整が必要か？

MMMで複数チャネルを扱う際、変数間のスケール差異が問題になります：

この500倍の差がある変数をそのままMCMCに投入すると、サンプリングが非常に不安定になります。

X_normalized = X / X.max()  # 値域：[0, 1]

用途：スペンド変数のデフォルト選択 メリット：直感的で解釈しやすい デメリット：外れ値に敏感

X_std = (X - X.mean()) / X.std()  # 平均0、標準偏差1

用途：気温・競合指数などのコントロール変数 メリット：正規分布に近い変数で最も安定 デメリット：負の値が出るのでスペンドには不自然

import numpy as np
X_log = np.log1p(X)  # log(x + 1)でゼロ値を安全処理

用途：右裾が重い売上データや広告費 デメリット：係数の解釈が乗法的になる

この先の内容（詳細な分析結果・具体的な数値・施策の全容）はBasicプラン以上のメンバー限定です。

PyMC-Marketingの上級機能を完全解説。階層ベイズGeoモデルによる地域別分析、HSGPによる時変パラメータ推定、リフトテスト統合、MV-ITSによるカニバリゼーション分析、時系列交差検証まで。

PyMC-MarketingのBG/NBDモデルとGamma-Gammaモデルを使い、顧客生涯価値（CLV）を不確実性付きで推定する実践ガイド。RFMデータの作成からセグメント別CRM戦略まで、完全なワークフローを解説します。

MMMの根幹をなす回帰分析の基礎を、数式だけでなく具体的な数値例を交えて分かりやすく解説。単回帰から重回帰、対数変換、ベイズ回帰まで、MMMに必要な統計知識を体系的に学べます。