🔖 Nivel 5: Grupos y Capturas - Dominando la Extracción Precisa

¡El poder de los grupos ()

Estas herramientas te permiten aislar partes específicas de tus coincidencias para extraer o manipular datos con precisión quirúrgica.

🧩 Conceptos Clave

  1. Grupos de Captura Básicos (patrón)

    • Crea subcoincidencias numeradas
    • Ejemplo: (\d{4})-(\d{2})-(\d{2}) para fechas ISO
  2. Grupos No Capturados (?:patrón)

    • Agrupa sin capturar (optimiza performance)
    • Ejemplo: (?:http|ftp):// para protocolos
  3. Retroreferencias \1, \2, etc.

    • Reutiliza grupos capturados
    • Ejemplo: (\w+) \1 para palabras repetidas

💻 Práctica con data.txt

Ejercicio 1: Reestructurar fechas

Patrón:

(\d{4})-(\d{2})-(\d{2})

Reemplazo:

\3/\2/\1  # Convierte YYYY-MM-DD → DD/MM/YYYY

Ejercicio 2: Extraer dominios de emails

Patrón:

\b\w+@([\w-]+\.[\w-]+)\b

Resultado:

  • Captura example.com de user@example.com

📊 Tabla de Usos Avanzados

Técnica Ejemplo Uso
Captura anidada ((\d{4})-(\d{2})) Aísla año-mes y componentes
Opciones múltiples (value1\|value2) Captura alternativas
Grupos con nombre (?<year>\d{4}) Acceso semántico

🛠 Flujo de Trabajo Profesional

  1. Prueba interactiva: Usa Alt+Enter para ver coincidencias
  2. Extracción selectiva: Copia sólo grupos específicos
  3. Transformación: Usa reemplazo con retroreferencias