¡Prepárate para dominar las expresiones regulares a nivel FBI de los datos! Este nivel contiene técnicas que solo el 1% de los usuarios regex conoce y aplica.
(?>a|b)c # Elimina backtracking catastrófico
Ejemplo práctico: Procesar logs de 10GB sin colgar Sublime Text
(?(?=prefix)then|else)
Caso real: Validar números de teléfono con o sin código de país:
^(?(?=\+\d{2})\(\d{3}\)\d{7}|\d{10})$
(?<word>\w+)(?:,\s*\g<word>)* # Listas como "item, item, item"
Magic: Analizar estructuras anidadas como JSON sin parser
\b(?:\p{L}\p{M}*)+(?:['’-]\p{L}\p{M}*)*\b # Palabras con apóstrofes y acentos
^[ACGT]{3,}(?:(?:[ACGT]{3})*TAA|TAG|TGA)$ # Buscar secuencias de terminación
(?s)(?<=\A)(?:(.)(?=.*(\Z|\z)))+ # Invertir orden en Sublime (con replace)
cat teradata.txt | xargs -P 8 -n 1000 grep -P 'patrón_complejo'
# Detección de inyección SQL mejorada
(?i)\b(?:union\s+select|exec\s+\(|cast\s*\(|xp_cmdshell|--\s|\/\*.*?\*\/|waitfor\s+delay)\b
# Extraer todos los atributos data-* de HTML
\bdata-[a-z-]+(?:=["'][^"']*["']|=[^\s>]+|)
# Parsear logs Apache con grupos nombrados
^(?<ip>\S+) \S+ \S+ \[(?<fecha>[^\]]+)\] "(?<metodo>\S+) (?<url>[^"]+) HTTP\/[0-9.]+" (?<status>\d{3}) (?<bytes>\d+) "(?<referer>[^"]*)" "(?<useragent>[^"]*)"
# Versión optimizada para 1TB de datos
(?=.*patrón)(?!.*exclusión)^(?:[^a]*a){3}[^a]*$ # Magic combo!
# Validador de RFC Mexicano (personas físicas)
^[A-ZÑ&]{4}\d{6}[A-V1-9][A-Z1-9][0-9A]$