Fran

Las expresiones regulares, más conocidas como Regex (del inglés Regular Expressions), son un lenguaje diseñado para describir patrones dentro de cadenas de texto. Dicho de forma sencilla, es una especie de “buscador avanzado” que permite localizar y manipular información según un conjunto de reglas muy concretas.

Por ejemplo, si quisieras encontrar todas las palabras que empiezan por «pre» en un documento, o todas las URLs que terminan en .html, podrías hacerlo con una sola instrucción en forma de Regex.

Se usan desde los años 50 y han evolucionado hasta convertirse en una herramienta indispensable en el mundo del desarrollo, la analítica digital y el SEO técnico.

Qué beneficios aportan las Regex

El principal beneficio de las expresiones regulares es la capacidad de ahorrar tiempo y simplificar procesos complejos. Por ejemplo:

  • Si gestionas un e-commerce con miles de productos, puedes usar una Regex para filtrar todos los que contengan la palabra “bicicleta” en su URL o Título.
  • Si necesitas validar que un correo electrónico introducido en un formulario sigue el formato correcto, lo puedes hacer con una Regex sin revisar manualmente cada caso.
  • Si extraes datos de un sitemap o de un HTML, puedes identificar solo los enlaces internos con un patrón.

Además, son compatibles con muchísimas herramientas: editores de texto como Visual Studio Code, hojas de cálculo, sistemas de bases de datos, aplicaciones web… en definitiva, todo lo que trabaje con texto.

Cómo funcionan las Regex

Una expresión regular se construye combinando caracteres normales (letras, números) con metacaracteres especiales que indican posiciones, repeticiones o condiciones.

Por ejemplo, este patrón:

^/blog/.*$

Se interpreta así:

  • ^ indica que la cadena debe empezar justo después de la barra.
  • /blog/ es texto literal.
  • .* significa “cualquier cosa, cualquier número de veces”.
  • $ marca que la cadena termina ahí.

Esto capturaría cualquier URL que comience con /blog/, como:

  • /blog/seo-tecnico
  • /blog/guia-regex

Pero no /tienda/blog/seo.

Otro ejemplo útil:

Si quieres localizar todas las URLs con extensión .html o .php:

\.(html|php)$

Este patrón capturaría:

  • /pagina.html
  • /producto.php

Pero no /carpeta/index.asp.

Dónde podemos utilizarlas

Las Regex tienen aplicaciones prácticamente en cualquier sitio donde trabajes con datos. Algunos ejemplos concretos:

  • En herramientas SEO:
    • En Screaming Frog puedes filtrar URLs que contengan parámetros:
      \?utm_
    • En Search Console puedes crear filtros avanzados de consultas:
      (marca|producto).*(precio|comprar)
  • En hojas de cálculo:
    • Usar REGEXEXTRACT para sacar un segmento de URL:
      =REGEXEXTRACT(A2,"/([a-z0-9\-]+)/$")
  • En bases de datos:
    • Buscar correos que terminen en un dominio:
      @midominio\.com$
  • En scripts y automatizaciones:
    • Limpiar textos o extraer datos masivamente con Python.
  • En editores de texto:
    • Reemplazar etiquetas HTML o formatear contenido en bloque.

Para qué podemos utilizarlas

Filtrar URLs en auditorías SEO

Ejemplo de regex:

\?utm_.*=

Localiza todas las URLs con parámetros de seguimiento.

Limpiar datos en hojas de cálculo

Ejemplo de regex:

<[^>]+>

Elimina etiquetas HTML de un texto.

Validar formatos de correo electrónico

Ejemplo de regex:

^[a-z0-9._%+-]+@[a-z0-9.-]+\.[a-z]{2,}$

Verifica si un email tiene un formato correcto.

Buscar y reemplazar contenido en masa

Ejemplo de regex:

\bantiguo\b

Encuentra la palabra “antiguo” para reemplazarla por otra.

Extraer información estructurada de documentos

Ejemplo de regex:

Precio:\s*([0-9.]+)

Captura el número que sigue a “Precio:”.

Extraer contenido de una página web

Ejemplo de regex:

<title>([^<]+)</title>

Obtiene el contenido de la etiqueta <title> de una página.

✅ Efectivamente, con Regex puedes extraer datos de una web. No tiene por qué ser precisamente tuya: puede ser de un competidor. Si te gustaría aprender más sobre cómo usarlas, mira este artículo de 7 Regex para usar en SEO.

Tablas de usos de Regex

Tabla de caracteres en regex

Carácter Leyenda Ejemplo de expresión Ejemplo de coincidencia
\d Coincide con cualquier dígito del 0 al 9. Producto_\d\d Producto_25
\w Coincide con letras, números o guiones bajos. \w+-\w+ SEO-2023
\s Coincide con cualquier espacio, tabulación o salto de línea. Palabra\spalabra Palabra palabra
\D Coincide con cualquier carácter que no sea un dígito. \D+ Version
\W Coincide con cualquier carácter que no sea letra, número o guión bajo. \W+ ***
\S Coincide con cualquier carácter que no sea un espacio. \S+ Palabra
. Coincide con cualquier carácter excepto el salto de línea. a.c abc
.* Coincide con cero o más caracteres de cualquier tipo. Blog.*SEO Blog avanzado SEO
\. Coincide con un punto literal. www\.dominio\.com www.dominio.com
\ Se utiliza para escapar un carácter especial. \.\*\+\? .*+?

Operadores lógicos en Regex

Operador Leyenda Ejemplo de expresión Ejemplo de coincidencia
| Actúa como un OR lógico entre varias opciones. SEO|SEM SEM
(…) Crea un grupo de captura. (blog|tienda) blog
\1 Hace referencia al contenido del primer grupo capturado. (\d\d)\1 1212
\2 Hace referencia al segundo grupo capturado. (\w+)-(\d+)-\2 item-45-45
(?:…) Crea un grupo sin captura (solo agrupación). colou?r color

Cuantificadores en regex

Cuantificador Leyenda Ejemplo de expresión Ejemplo de coincidencia
+ Coincide con una o más repeticiones del elemento anterior. \d+ 2023
{3} Coincide con exactamente tres repeticiones. a{3} aaa
{2,4} Coincide con entre dos y cuatro repeticiones. \d{2,4} 123
{3,} Coincide con tres o más repeticiones. x{3,} xxxxxx
* Coincide con cero o más repeticiones. a* aaa
? Coincide con una o ninguna repetición. http[s]? https

Cómo generar regex para utilizarlas en SEO

Aprender a construir expresiones regulares puede parecer complicado al principio, pero la realidad es que hoy en día disponemos de herramientas y recursos que facilitan muchísimo el proceso. Aquí tienes algunas recomendaciones prácticas si estás empezando o si quieres optimizar tus propias Regex para proyectos SEO:

1. Empieza con una idea clara de qué patrón quieres detectar

Antes de lanzarte a escribir caracteres especiales, define exactamente qué estás buscando. Por ejemplo:

  • ¿Quiero filtrar todas las URLs que terminan en .html?
  • ¿Necesito identificar rutas que contengan /blog/?
  • ¿Quiero extraer el slug final de una URL con IDs?

Cuanto más específico sea tu objetivo, más sencilla será tu expresión regular.

2. Utiliza herramientas interactivas para probar tus Regex

Hay webs que te permiten escribir la Regex y comprobar en tiempo real qué coincidencias obtiene. Dos de las más recomendables son:

  • Regex101: probablemente el editor más popular. Te explica cada parte del patrón, te muestra coincidencias en directo y permite guardar tus pruebas.
  • El Placer del SEO: una herramienta sencilla en español donde puedes comprobar tus Regex de forma visual y ver ejemplos aplicados al SEO.

Estas páginas son perfectas para aprender poco a poco y afinar la sintaxis sin miedo a equivocarte.

3. Apóyate en ChatGPT para escribir y entender Regex

Por supuesto, puedes preguntarle directamente a ChatGPT para que te ayude a:

  • Generar una Regex a partir de una descripción en lenguaje natural.
  • Explicar qué hace una expresión que ya tengas y que no entiendas.
  • Proponer ejemplos de uso en Screaming Frog, Google Sheets o Search Console.

Por ejemplo, puedes decir:
«Ayúdame a crear una expresión regular que filtre URLs que empiecen por /blog y terminen en /»
y te dará el patrón junto con la explicación paso a paso.

4. Documenta tus expresiones y revísalas con ejemplos reales

Cuando termines tu Regex, guárdala junto con un comentario de qué hace y en qué contexto la vas a usar. Después, pruébala sobre un listado de URLs reales para asegurarte de que no devuelve coincidencias inesperadas.

Conclusión

Crear expresiones regulares para SEO no tiene por qué ser complicado si cuentas con las herramientas adecuadas y un método ordenado. Empieza por definir tu objetivo, apóyate en webs como Regex101 y El Placer del SEO, y no dudes en pedir ayuda a ChatGPT cuando necesites inspiración o explicaciones claras.

Como has visto, las expresiones regulares son una de las herramientas más poderosas y versátiles que puedes aprender si trabajas con datos, SEO o desarrollo web. Aunque su sintaxis pueda intimidar, con práctica verás que permiten automatizar procesos que de otro modo llevarían horas.

Si quieres empezar a probarlas, puedes usar herramientas como Regex101, que te ayudan a entender cada patrón en tiempo real. Con un poco de práctica, te convertirás en un auténtico ninja de las Regex.