Google Meridian e il Marketing Mix Modeling bayesiano: guida tecnica per agenzie e analisti

Al momento stai visualizzando Google Meridian e il Marketing Mix Modeling bayesiano: guida tecnica per agenzie e analisti

Il problema che Meridian risolve (e che molte agenzie ignorano)

C’è una conversazione che si ripete ogni trimestre in quasi ogni agenzia media: il cliente chiede “ma quanto sta davvero funzionando la TV rispetto ai social?”, e la risposta è spesso un mix di last-click attribution, piattform-reported ROAS e intuizioni di esperienza. Non è colpa di nessuno — per anni è stato il meglio che si poteva fare.

Google Meridian cambia questa conversazione in modo strutturale.

Non si tratta di un nuovo tool di reporting, né di un’evoluzione del classico dashboard analytics. Meridian è un framework statistico open source che sposta il baricentro della misurazione dal dato individuale (cookie, click, sessione) al dato aggregato modellato con metodi bayesiani. È un cambio di paradigma metodologico, e capirlo davvero — non solo a livello superficiale — è diventato un vantaggio competitivo per qualsiasi agenzia che lavora su budget media significativi.

In questa guida tecnica analizziamo Meridian dall’interno: architettura del modello, pipeline di dati, calibrazione, output interpretativi e implicazioni operative per chi lavora in agenzia.

Architettura del modello: cosa gira sotto il cofano

Il framework probabilistico bayesiano

Meridian è costruito su TensorFlow Probability e JAX, due librerie di calcolo scientifico ad alte performance. Il cuore del sistema è un modello bayesiano gerarchico che stima le distribuzioni a posteriori dei parametri attraverso algoritmi MCMC (Markov Chain Monte Carlo), nello specifico NUTS (No-U-Turn Sampler), una variante efficiente di HMC (Hamiltonian Monte Carlo).

Cosa significa in pratica per un analista?

In un modello frequentista classico (OLS), ogni parametro ha un valore puntuale: “il coefficiente della TV è 0.42”. In Meridian, ogni parametro è una distribuzione: “il coefficiente della TV ha media 0.42, deviazione standard 0.09, e i percentili 5-95 vanno da 0.27 a 0.58”. Questa differenza non è cosmеtica — è la differenza tra una risposta e una risposta con il suo margine di errore incorporato.

Struttura gerarchica multi-geografica

Una delle innovazioni più rilevanti di Meridian rispetto a strumenti precedenti (incluso il Lightweight MMM di Google stesso) è la struttura gerarchica su dimensione geografica.

Il modello può operare in due modalità:

  • Modalità nazionale: dati aggregati a livello paese, approccio più semplice ma meno granulare
  • Modalità geo: dati disaggregati per regione o area geografica, con effetti parzialmente in pool tra le geo

La modalità geo è quella più potente. Sfrutta il partial pooling bayesiano: le aree geografiche con pochi dati “prendono a prestito” forza statistica dalle aree con più osservazioni, evitando sia l’overfitting (modelli separati per ogni geo) che l’underfitting (un solo modello nazionale). È l’approccio gerarchico classico formalizzato da Gelman et al., applicato al contesto media.

Esempio operativo: un’agenzia gestisce campagne per una catena retail con 8 regioni italiane. Le regioni del Sud hanno volumi di vendita più bassi e quindi meno dati. Con il partial pooling, il modello usa le informazioni delle regioni del Nord per stabilizzare le stime al Sud, producendo output coerenti anche dove i dati sono sparsi.

Pipeline dei dati: dalla raccolta al modello

La qualità di un modello MMM dipende quasi interamente dalla qualità dei dati di input. Questo è il punto dove la maggior parte dei progetti fallisce — non per limiti del software, ma per problemi upstream.

Frequenza e storico minimo

  • Frequenza: settimanale (raccomandata) o giornaliera
  • Storico minimo: 2 anni, idealmente 3 anni
  • Canali media: tutti i canali con investimento superiore al 2-3% del budget totale (sotto quella soglia il segnale è statisticamente rumoroso)

Integrazione con Google Ads: reach e frequenza

Una delle feature distintive di Meridian è la possibilità di sostituire la variabile di spesa con quella di reach per i canali Google Ads e YouTube. Questo richiede l’accesso all’API di Google Ads e l’esportazione dei report di reach unica settimanale.

Il vantaggio è sostanziale: la spesa è un proxy imperfetto dell’esposizione reale. Due campagne con lo stesso budget possono raggiungere audience molto diverse per ampiezza e frequenza. Modellare direttamente il reach migliora la stima dell’adstock e della saturazione, specialmente per i canali video.

Media Mix Data Structure
Python / Pandas
 # Esempio di struttura dati con reach invece di spesa per YouTube media_data = pd.DataFrame({

    'date':
    weekly_dates,

    'youtube_reach':
    youtube_weekly_reach,

    # Reach unica settimanale 'youtube_frequency':
    youtube_weekly_freq,

    # Frequenza media settimanale 'search_impressions':
    search_impressions,

    # Impression Search 'tv_grp':
    tv_weekly_grp,

    # GRP TV settimanale 'display_spend':
    display_weekly_spend # Spesa display (no reach disponibile)

})

Calibrazione dei prior: la parte più critica (e più sottovalutata)

Qui sta la vera complessità — e la vera opportunità — di Meridian rispetto agli strumenti black-box.

In un modello bayesiano, i prior sono le nostre credenze iniziali sui parametri, prima di vedere i dati. Meridian permette di specificare prior per:

  • Decay dell’adstock (quanto velocemente l’effetto pubblicitario si esaurisce)
  • Parametri di saturazione (forma e punto di saturazione della curva S o hill)
  • Elasticità dei canali (sensibilità delle vendite alle variazioni di investimento)

Da dove vengono i prior giusti?

Meridian include un set di prior di default calibrati empiricamente da Google su un ampio dataset di campagne reali. Questi prior di default sono un buon punto di partenza, ma non sono universali.

Per un’agenzia, la corretta calibrazione dei prior è un asset competitivo. Le fonti principali per prior personalizzati sono:

  1. Geo-experiments pregressi: se hai già condotto holdout test geografici, usa le stime di incrementalità come prior per l’efficacia del canale
  2. Conversion lift studies: i risultati di brand lift o conversion lift di YouTube/Meta possono ancorare il prior sull’efficacia del canale video
  3. Letteratura di settore: paper come quelli di Binet & Field (Les Binet) offrono riferimenti empirici su decay rates per settore
  4. Modelli precedenti: se esiste un MMM storico, anche frequentista, le sue stime sono un punto di partenza
Custom TV Prior — Meridian
Python
 # Esempio di prior personalizzato per il canale TV in Meridian from meridian import prior_distribution as pd_meridian

custom_tv_prior = {

    'roi_rf':
        pd_meridian.HalfNormal(
            scale=0.5
        ),

    # ROI atteso 'hill_slope':
        pd_meridian.HalfNormal(
            scale=1.0
        ),

    # Forma curva saturazione 'hill_half_saturation':
        pd_meridian.Gamma(
            concentration=2.0,
            rate=1.0
        )

    # Punto di semi-saturazione

}

Validazione del modello: come capire se funziona davvero

Un modello MMM non si valida con una R² alta. Questo è uno degli errori più comuni.

Posterior predictive checks

Il primo strumento di validazione è il posterior predictive check: campionare dal modello stimato e confrontare le predizioni con i dati osservati. Un modello ben calibrato deve:

  • Riprodurre la media e la varianza della serie storica KPI
  • Catturare i picchi stagionali
  • Non avere residui sistematici per nessun canale

LOO-CV e WAIC

Per la selezione del modello (confronto tra specifiche diverse), Meridian supporta tecniche di cross-validation bayesiana come LOO-CV (Leave-One-Out Cross-Validation) e WAIC (Widely Applicable Information Criterion). Questi indicatori penalizzano la complessità del modello, evitando l’overfitting.

Calibrazione con holdout geografici

Il test più robusto rimane la calibrazione esterna: eseguire un geo-experiment in parallelo con il modello e verificare che le stime di Meridian siano coerenti con i risultati dell’holdout. Una discrepanza sistematica indica un problema di specificazione o di qualità dei dati.

Per le agenzie, questa doppia validazione — modello + geo-experiment — è il gold standard del measurement.

Output di Meridian: come leggere e comunicare i risultati

Response curves e ottimizzazione del budget

L’output più operativo di Meridian sono le response curves per ogni canale: curve che mostrano il ritorno marginale atteso (in termini di KPI) in funzione della spesa o del reach. Ogni curva viene prodotta con bande di incertezza al 90%.

Queste curve permettono di:

  • Identificare il punto di saturazione di ogni canale
  • Calcolare il ROI marginale all’investimento attuale vs. investimento ottimale
  • Simulare scenari di riallocazione del budget con output probabilistici

Scenario attuale

TV
€500K / settimana
ROI marginale: 1.2x [0.9x – 1.6x]
Search
€120K / settimana
ROI marginale: 3.1x [2.7x – 3.5x]
YouTube
€180K / settimana
ROI marginale: 2.4x [1.9x – 3.0x]
Display
€90K / settimana
ROI marginale: 0.8x [0.5x – 1.1x]

Scenario ottimizzato

TV
€380K / settimana
↓ Ridotto
Search
€210K / settimana
↑ Aumentato
YouTube
€240K / settimana
↑ Aumentato
Display
€60K / settimana
↓ Ridotto
Revenue attesa
+8.3%
Intervallo previsto: [+5.1% – +11.7%]
Confidenza statistica: 90%

Decomposizione del revenue

Un output fondamentale è la revenue decomposition: quanto del KPI è spiegato da ciascun canale media, dalla baseline (vendite strutturali indipendenti dall'advertising) e dai fattori di controllo (stagionalità, prezzo, promozioni).

Questa decomposizione, con le sue bande di incertezza, è il principale strumento di reporting verso il cliente. La baseline in genere costituisce il 60-75% del totale — un dato che spesso sorprende i clienti abituati al pensiero "tutto dipende dall'advertising".

Implicazioni operative per le agenzie

Come strutturare il processo con il cliente

Un progetto Meridian in agenzia richiede di ridefinire alcuni processi tipici:

Fase 1 – Data audit (2-3 settimane) Raccolta e verifica di tutti i dati media (spesa o reach per canale, per settimana, per geo), KPI di business (vendite, lead, revenue) e variabili di controllo. Questa fase richiede accesso a fonti spesso disperse: piattaforme DSP, CRM, dati di distribuzione, dati di prezzo.

Fase 2 – Specificazione e calibrazione (2-3 settimane) Definizione della struttura del modello: quali canali includere, quale granularità geografica usare, quali prior specificare. Questa è la fase dove l'expertise statistica dell'agenzia fa la differenza.

Fase 3 – Stima e validazione (1-2 settimane) Fitting del modello, posterior predictive checks, sensitivity analysis sui prior, eventuale calibrazione con holdout data.

Fase 4 – Reportistica e ottimizzazione (ongoing) Traduzione degli output tecnici in raccomandazioni di budget actionable. La cadenza tipica è trimestrale per il refitting completo, con aggiornamenti mensili leggeri.

Il vantaggio competitivo per l'agenzia

Le agenzie che padroneggiano Meridian hanno un argomento di valore concreto da portare ai clienti: una risposta metodologicamente rigorosa alla domanda "funziona davvero?", indipendente dal bias delle piattaforme e dal tracking individuale.

In un mercato dove sempre più clienti cercano trasparenza sulla misurazione, questo è un differenziatore significativo — specialmente con l'avvicinarsi della completa deprecazione dei cookie third-party.

Limitazioni che ogni analista deve conoscere

Essere onesti sulle limitazioni di Meridian è parte integrante di un approccio professionale:

  • Non è real-time: il modello è retrospettivo. Non può rispondere a "come sta andando questa campagna questa settimana"
  • Non identifica la causalità: come ogni modello correlazionale, Meridian stima associazioni. La causalità richiede esperimenti
  • Dipende dalla qualità dei dati: garbage in, garbage out vale ancora e sempre
  • La convergenza MCMC richiede verifica: i diagnostici di Gelman-Rubin (R-hat) e ESS (Effective Sample Size) devono essere controllati prima di interpretare i risultati
  • I prior influenzano i posterior con pochi dati: in geo con pochi dati o canali con poca variazione, i prior dominano — un rischio da comunicare chiaramente

Meridian come infrastruttura di measurement, non come tool

Il vero salto di qualità che Google Meridian porta alle agenzie non è nella singola analisi che produce, ma nell'infrastruttura metodologica che costruisce nel tempo. Un modello MMM che viene aggiornato e calibrato regolarmente, arricchito da geo-experiments, integrato con i dati di prima parte del cliente, diventa un asset strategico crescente.

Per le agenzie che vogliono posizionarsi come partner di measurement — non solo come esecutori media — investire nella competenza tecnica su Meridian è una delle scelte più strategiche che si possono fare oggi.

Vuoi approfondire l'implementazione di Google Meridian per i tuoi clienti?

Il nostro team di data science e analytics lavora con agenzie e brand per costruire pipeline MMM robuste, dalla raccolta dei dati alla reportistica esecutiva. Scrivici per una sessione tecnica gratuita di valutazione della fattibilità sul tuo stack attuale.

  • Categoria dell'articolo:SITI WEB / SOCIAL
  • Tempo di lettura:10 min di lettura