robots.txt: El mapa secreto que los admin olvidan esconder
May 30, 2025
El archivo robots.txt es como ese letrero que dice “No mires aquí” justo donde deberías mirar.
Y sí, los pentesters lo sabemos bien 😼📜
🧠 ¿Qué es robots.txt?
Es un archivo de texto ubicado en la raíz de un sitio web, que sirve para dar instrucciones a los bots de indexación (como los de Google).
Ejemplo de ruta:
https://target.com/robots.txt
📦 ¿Qué contiene?
Instrucciones como:
User-agent: *
Disallow: /admin
Disallow: /backup/
Allow: /public
Esto significa:
- Los bots NO deben entrar a
/adminni a/backup - Pero sí pueden indexar
/public
🐾 ¿Por qué es importante en un pentest?
Porque muchos administradores olvidan que los humanos también podemos leerlo.
Y a veces dejan ahí pistas como:
/test//dev//staging//old//wp-admin//cgi-bin//backup.zip
🔍 ¡O incluso rutas que revelan paneles de administración o archivos sensibles!
🛠️ Cómo analizarlo en un pentest
1. Accede directo al archivo
curl https://target.com/robots.txt
2. Busca rutas sospechosas o jugosas
- ¿Hay directorios de admin?
- ¿Archivos
.zip,.bak,.sql,.log? - ¿Subdominios o endpoints antiguos?
3. Úsalo como wordlist para ffuf o dirb
ffuf -u https://target.com/FUZZ -w robots_paths.txt
🛡️ Precauciones
- El archivo no es un mecanismo de seguridad, solo una sugerencia para bots.
- Los atacantes lo usan para buscar rutas restringidas.
- Algunos WAFs monitorean su lectura con frecuencia sospechosa.
🚀 Pro tip galáctico
Si encuentras algo como:
Disallow: /sistema-secreto/
📎 Ve directamente a:
https://target.com/sistema-secreto/
¡Y explora si está abierto al público! 🕵️♀️
🚩 Conclusión Espacial
robots.txt es como un diario a medio esconder:
no fue hecho para ti… pero igual lo puedes leer.
Y muchas veces, revela más de lo que debería. 😼💣
✨ “Todo buen pentester mira donde nadie quiere que mires.” — l1ttl3bugc4t