‘Web-scraping’: ¿técnica beneficiosa o maliciosa?

un internauta realiza una búsqueda en un navegador web
Redacción

Como bien es sabido, las nuevas tecnologías están en un desarrollo exponencial. Y esto trae nuevas ciberamenazas que ponen en riesgo a todo tipo de organizaciones y usuarios. Incluso, en algunos casos, los ciberdelincuentes emplean técnicas digitales legítimas de forma maliciosa. Una de ellas es el web scraping. Pero, ¿cómo atacan los ciberdelincuentes con ella?

¿Qué es el ‘web scraping’?

También se denomina «raspado web«. Su propósito es recopilar datos de una web mientras se obtiene una ventaja competitiva con ayuda de la inteligencia empresarial. No obstante, al tratarse de una técnica informática, es necesario una aplicación o software. Sabiendo esto, los ciberdelincuentes aplican el web scraping de forma maliciosa para extraer, sin permiso alguno, datos del sitio web para su posterior ataque.

Para ello utilizan bots. De hecho, la Inteligencia Artificial juega su papel en este sentido. No en vano, los ‘malos’ la suelen utilizar para buscar datos concretos de una web para luego copiarlos y posteriormente someterlos a análisis.

Entre las herramientas comunes de web scraping se incluyen Bright Data, Scrape.do, Diffbot y Scrapy.

‘Web scraping’ malicioso

Por desgracia, esta técnica es utilizada en muchos tipos de ciberataques. Por ejemplo, de phishing, en la distribución de malware mediante enlaces o archivos o en ataques que pueden paralizar un sitio web o aplicación.

En cuanto a su tipología, existen dos clases de web scraping:

  • Over-scraping. Se envían excesivas solicitudes en poco tiempo para sobrecargar los servidores del sitio web y así afectar al rendimiento y experiencia del usuario.
  • Scrapers-Ping. Perjudican a las visitas web degradando el rendimiento de sitio para que sus consumidores abandonen.

Prevención

Sin embargo, existen productos en el mercado capaces de detectar y mitigar el web scraping evasivo. Unos productos que incluyen características como: evaluación a nivel de protocolo, a nivel de aplicación, de la interacción y comportamiento del usuario y clasificación de riesgo.

Como medidas adicionales, velar por el rendimiento y calidad de la web es importante. Además, usar una red privada virtual (VPN) para ocultar la dirección IP, evitar compartir datos personales en línea, no hacer clic en enlaces de fuentes desconocidas, no usar la misma contraseña para todos los sitios web y activar la autenticación multifactor, entre otras acciones, harán mas complicado sufrir el raspado web.