ESET, compañía de seguridad informática, analiza esta herramienta de automatización de tareas para extraer datos de sitios web y almacenarlos, que puede ser útil para cualquier usuario, pero también servir a actores malintencionados.
El web scraping es una técnica que permite recopilar información específica de sitios web o servicios de manera automatizada. ESET, una empresa líder en detección de amenazas, explica su funcionamiento y comparte consejos de seguridad para su uso.
Por ejemplo, si necesitas obtener cotizaciones diarias de divisas extranjeras y criptomonedas, el web scraping puede agilizar el proceso al recopilar toda la información en uno o dos clics. Cualquier usuario puede realizar web scraping, ya que accede automáticamente a la información de un sitio web. Sin embargo, es importante tener en cuenta dos puntos clave según ESET:
Los delincuentes utilizan el web scraping para configurar bases de datos con fines maliciosos, como la recopilación de información personal para su venta en foros de la Deep o Dark Web. Un ejemplo de esto ocurrió cuando una tienda en línea expuso públicamente los datos de registro de sus clientes, lo que permitió a los delincuentes crear un raspador para recopilar y almacenar esta información.
Riesgo de denegación de servicio (DDoS): Al realizar web scraping a través de la línea de comandos, es posible generar una gran cantidad de solicitudes en poco tiempo. Si no se configura correctamente, esto puede interpretarse como un ataque DDoS y resultar en un bloqueo temporal o permanente de la IP que realiza el scraping.
Si deseas aventurarte en el estudio del web scraping, es importante ajustar el número de peticiones por segundo, establecer intervalos entre las solicitudes y configurar un límite máximo para interrumpir el proceso de scraping.
ESET comparte algunos consejos de seguridad para lidiar adecuadamente con el web scraping:
No te preocupes demasiado por el bloqueo: En lugar de preocuparte por ser bloqueado, enfócate en garantizar un acceso legítimo a la información.
Asegúrate de que los datos sean accesibles solo por la persona correspondiente: Ajusta las autorizaciones de acceso para evitar que toda la base de datos esté disponible para cualquier usuario autenticado.
Dimensiona adecuadamente los recursos del servidor considerando el exceso de conexiones que pueden ocurrir periódicamente.
Configura los bloqueos automáticos correctamente: Ajusta la sensibilidad del sensor para limitar los raspados no deseados o asegúrate de que los bloqueos no sean permanentes.
En resumen, el web scraping puede ser una herramienta útil, pero es importante utilizarla de manera responsable y tomar precauciones de seguridad para evitar su uso malintencionado o problemas técnicos.
Publicar un comentario