B
Blockecito

La Guía Definitiva de Medición SEO: Uniendo GSC, GA4 y BigQuery para Insights de Negocio

Analytics Avanzado Por Blockecito
La Guía Definitiva de Medición SEO: Uniendo GSC, GA4 y BigQuery para Insights de Negocio

Una guía técnica y estratégica para analistas y SEOs. Aprende a crear un pipeline de datos desde Google Search Console y GA4 hacia BigQuery, con ejemplos de SQL para análisis avanzados y visualización.

Introducción: Por Qué la Medición Fragmentada Limita tu Crecimiento

Como profesionales del SEO y el marketing, vivimos en silos de datos: Google Search Console (GSC) nos dice qué pasa antes del clic, y Google Analytics 4 (GA4) nos dice qué pasa después. Esta separación nos impide responder a las preguntas más importantes: ¿Qué keywords atraen a los usuarios más comprometidos? ¿Qué contenido genera más ingresos? ¿Cómo afecta el rendimiento técnico al comportamiento del usuario? La solución es centralizar estos datos en un data warehouse como Google BigQuery. Esta guía te mostrará, paso a paso, cómo construir este pipeline y ejecutar consultas que transformarán tus datos en decisiones de negocio.

Paso 1: Configuración del Pipeline de Datos (GSC/GA4 → BigQuery)

Activando la Exportación de GA4 a BigQuery

En la administración de tu propiedad GA4, ve a 'Vinculaciones con BigQuery'. Necesitarás un proyecto de Google Cloud con facturación activada. Selecciona la opción de exportación 'Diaria' (y 'Streaming' si necesitas datos en tiempo real). Esto creará automáticamente un dataset en BigQuery con tablas particionadas por día (`events_YYYYMMDD`).

Activando la Exportación de Google Search Console a BigQuery

En la configuración de tu propiedad de GSC, ve a 'Exportación de datos masiva'. Este proceso también requiere un proyecto de Google Cloud y creará tablas específicas como `searchdata_site_impression` y `searchdata_url_impression`, que contienen datos a nivel de consulta y URL, mucho más granulares que la API.

Nota sobre costes: BigQuery cobra por almacenamiento y por la cantidad de datos procesados en cada consulta. Usa particiones en tus cláusulas `WHERE` (ej. `WHERE _TABLE_SUFFIX BETWEEN '...' AND '...'`) para limitar los costes.

Paso 2: Análisis Avanzado con SQL - Casos de Uso Prácticos

Una vez que los datos fluyen, podemos empezar a unirlos. La clave de unión entre GSC y GA4 suele ser la URL de la página de destino (`page` en GSC, `page_location` en GA4) y la fecha.

Caso de Uso 1: Encontrar 'Keywords con Potencial Oculto'

Objetivo: Identificar keywords que generan mucho tráfico pero tienen un bajo engagement, indicando una discrepancia entre la intención de búsqueda y el contenido de la página. La query une los datos de GSC y GA4 por landing page y fecha, y luego filtra por keywords con alto número de clics pero bajo tiempo de interacción promedio.

WITH GSC_Data AS (
  SELECT date, page, query, clicks
  FROM `your_project.your_gsc_dataset.searchdata_site_impression`
),
GA4_Data AS (
  SELECT
    CAST(event_date AS DATE) AS date,
    (SELECT value.string_value FROM UNNEST(event_params) WHERE key = 'page_location') AS page,
    AVG((SELECT value.int_value FROM UNNEST(event_params) WHERE key = 'engagement_time_msec')) AS avg_engagement_time
  FROM `your_project.your_ga4_dataset.events_*`
  WHERE event_name = 'session_start'
  GROUP BY 1, 2
)
SELECT
  g.query, g.page, g.clicks, ga.avg_engagement_time
FROM GSC_Data g
JOIN GA4_Data ga ON g.page = ga.page AND g.date = ga.date
WHERE g.clicks > 100
ORDER BY ga.avg_engagement_time ASC
LIMIT 50;

Caso de Uso 2: Atribución de Ingresos a Contenido Orgánico

Objetivo: Determinar qué artículos del blog o páginas de contenido generan más ingresos. Esta query une los eventos de `purchase` de GA4 con los datos de sesión para encontrar la landing page orgánica y luego suma los ingresos.

SELECT 
  (SELECT value.string_value FROM UNNEST(event_params) WHERE key = 'page_location') AS landing_page,
  SUM(ecommerce.purchase_revenue) AS total_revenue
FROM `your_project.your_ga4_dataset.events_*`
WHERE event_name = 'purchase'
  AND (SELECT value.string_value FROM UNNEST(event_params) WHERE key = 'source') = 'google'
  AND (SELECT value.string_value FROM UNNEST(event_params) WHERE key = 'medium') = 'organic'
GROUP BY 1
ORDER BY 2 DESC;

Paso 3: Visualización y Democratización de los Datos

Los datos en BigQuery solo son útiles si se pueden visualizar y entender. Conecta BigQuery como fuente de datos a Looker Studio (anteriormente Google Data Studio).

  • Crea un Dashboard de 'Salud de Contenido': Visualiza una tabla con tus URLs más importantes, mostrando clics (GSC), sesiones (GA4), tiempo de engagement (GA4) y conversiones (GA4). Esto te da una vista de 360 grados del rendimiento de cada página.
  • Crea un Dashboard de 'Oportunidades de Keywords': Muestra una lista de las keywords del Caso de Uso 1 para que el equipo de contenido pueda actuar sobre ellas.
  • Crea Dashboards por Equipo: Un dashboard para el equipo de producto centrado en el uso de features, y otro para marketing centrado en la atribución de canales.

Conclusión: De la Recolección de Datos a la Toma de Decisiones

La creación de un pipeline de datos unificado con BigQuery es una inversión técnica que paga dividendos estratégicos inmensos. Te permite pasar de responder 'qué pasó' a entender 'por qué pasó' y predecir 'qué pasará si...'. Al conectar el comportamiento pre-clic con el comportamiento post-clic y los resultados de negocio, el SEO deja de ser una caja negra y se convierte en una palanca de crecimiento medible y optimizable en todos los niveles de la organización.

Te podría interesar