Cortando URLS en informes de Looker Studio

Cortando URLS en informes de Looker Studio

En los informes de Looker Studio hay veces que deseamos mostrar las URLS de las páginas, pero sin elementos superfluos como los nombres de dominio o los parámetros:

  • El nombre del dominio: tanto nosotros como el cliente ya sabemos de qué web es el informe, no tiene sentido mostrarlo y ocupar espacio de forma innecesaria.
    El informe es de la web: https://dominio.com, no queremos que esto se repita una y otra vez.
  • Los parámetros: pueden ser, por ejemplo, parámetros de Google Ads, como el famoso ?gclid=, o parámetros de búsqueda de la propia web, como ?s= ó ?search=. Esto provoca que se muestren las mismas URLS con parámetros distintos, lo que aumenta los resultados de forma innecesaria.

Lo único que queremos es mostrar las URLS completamente limpias:
/

/sección/página/

/página/

Para solucionar el problema de que no tengamos ocasión natural de tenerlas así, es necesario utilizar un campo calculado.

Crear campo calculado

En este ejemplo, es el campo de GA4 denominado page_location el que queremos depurar. Podemos llamar al nuevo campo calculado: page_location_simple:

CASE
  WHEN page_location = "https://dominio.com/" THEN "/"
  ELSE CONCAT("/", REGEXP_REPLACE(page_location, "^https://dominio.com(/)?(.*?)(\\?.*)?$", "\\2"))
END

Explicación del código

CASE WHEN page_location = «https://dominio.com/» THEN «/»:

Esta parte de la fórmula verifica si la URL es exactamente «https://dominio.com/». Si es así, devuelve «/», que es la ruta correcta para la página principal.

ELSE CONCAT(«/», REGEXP_REPLACE(page_location, «^https://dominio.com(/)?(.?)(\?.)?$», «\2»)):

Si la URL no es la página principal, se ejecuta esta parte. Se usa CONCAT para añadir una barra diagonal «/» al principio de la ruta extraída con REGEXP_REPLACE. Esto asegura que todas las rutas comiencen con «/».

^https://dominio.com(/)?: Esta parte de la expresión regular coincide con el inicio de la URL (el dominio principal). El (/)? permite que coincida tanto si la URL tiene una barra diagonal después del dominio como si no.
(.?): Este grupo captura la parte de la URL que queremos conservar (la ruta de la página). El .? coincide con cualquier carácter (.) cero o más veces (), pero de forma no codiciosa (?), lo que significa que se detendrá en la primera coincidencia posible.

(\?.)?: Este grupo coincide con cualquier parámetro que siga a un signo de interrogación (?). El (\?.*)? permite que coincida tanto si la URL tiene parámetros como si no.

«\2»: Esta parte de la fórmula indica que queremos reemplazar toda la URL original por el segundo grupo capturado, que es la ruta de la página.

Resultado final

Gracias a este campo calculado, pasaremos de esto:

Reemplazar URLS en Looker Studio

a esto otro:

URLS cortadas en Looker Studio

Optimizando las URLS del informe para evitar información y duplicidades innecesarias.

Este tipo de campo se puede utilizar en cualquier conexión que lo permita, como por ejemplo GA4 o Search Console, siempre y cuando se tengan los suficientes permisos.