La legalidad del web scraping: el caso Ryanair

La automatización llega a todas partes, amigas y amigos, incluyendo la búsqueda de información en la Red. Mientras antes tenías que visitar las páginas web una a una, para obtener la información y tomar decisiones, ahora puede optar por el screen scraping o web scraping: ingeniería inversa para obtener información mostrada en una web y ponerla disponible en otra. Como intercambiar cromos, pero teniendo el mismo cromo en dos lugares distintos, que da más juego.

Con carácter general los Términos y Condiciones de uso de las páginas webs suelen tener un apartado por el que no permiten esta actividad, o al menos no con fines comerciales. Por ejemplo los Términos y Condiciones de la web del periódico Marca dicen:

3.4. Asimismo está prohibido modificar, copiar, reutilizar, extraer, explotar, reproducir, comunicar públicamente, hacer segundas o posteriores publicaciones, cargar archivos, enviar por correo, transmitir, usar, tratar o distribuir de cualquier forma la totalidad o parte de los contenidos incluidos en el Sitio Web si no se cuenta con la autorización expresa y por escrito de UNIDAD EDITORIAL o, en su caso, del titular o titulares de los derechos a que corresponda.”

Sin embargo no estaría escribiéndote este post si la gente hiciera caso a todo lo que se escribe en los Términos y Condiciones de las webs. Más bien al contrario, lo normal es que a la gente le importe una mierda muy poco lo que dicen las normas de acceso y uso web, de hecho la mentira más repetida de internet es esa de “He leído y acepto las condiciones del servicio” que todos marcamos de forma más o menos automatizada al navegar. Esa y la de las cookies.

Quizá el caso más sonado en España haya sido el de Ryanair, que demandó a ATRAPALO SL, agencia de viajes online, por utilizar una spider que extraía la información relativa a sus vuelos (precios, horarios, destinos). El asunto se puso chungo y llegó hasta el Supremo, si no quieres seguir leyendo el artículo puedes leerte la sentencia entera aquí: STS,Sala de lo Civil, número 572/2012, de 9 de octubre de 2012, JUR 2012, 383308.

Para resumirte los hechos Ryanair pedía que las webs fueran condenadas por incumplir los términos y condiciones, por pasarse por el forro su derecho de propiedad intelectual sobre la base de datos y el software de la empresa, y por competencia desleal. ATRAPALO contestó que lo que habían hecho no era ilegal y que le dieran por saco a Ryanair.

De hecho, es lo que ocurrió: a Ryanair le dieron por saco en primera y segunda instancia (o sea, dos veces seguidas), y por este motivo acudieron al Tribunal Supremo de todo esto, para que pusiera un poco de orden. Quizá alguno de los magistrados había volado con la compañía y les tenía tirria, quizá la ley es algo que debería ser más claro para que no haya tanto libre albedrío con su interpretación.

El recurso de casación de Ryanair planteaba a los magistrados supremos las siguientes cuestiones:

  1. Navegar por la web supone la formalización de un contrato entre Ryanair y el usuario.

  2. No se han respetado las normas que protegen las bases de datos.

  3. La actividad de ATRAPALO S.L. es un acto desleal, al aprovecharse del esfuerzo y de la reputación de Ryanair para ofrecer vuelos baratos.

Como dijo Jack el Destripador en su día, vayamos por partes:

a) El recurso de casación. WTF?

Para los no iniciados, José Flors Matíes define el recurso de casación como aquel recurso en el que se solicita al Supremo que “verifique un examen de la aplicación de las normas jurídicas realizadas por el tribunal “a quo” en la decisión de la cuestión de fondo objeto del proceso, a fin de que corrija dicha aplicación, si aquéllas se hubieren infringido, y, en su caso, unifique o defina la doctrina jurisprudencial sobre la materia.” Básicamente es la reválida de las sentencias.

Al ser extraordinario, sólo se admitirá si se cumplen los requisitos legales, y están limitadas las posibilidades de alegación y aportación de prueba. Como la revisión de un examen: si no lo hiciste o dijiste antes, ahora no puedes hacerlo. No es un juicio nuevo, por este motivo el tribunal no admite a Ryanair una serie de documentos y le critica que no haya utilizado los recursos ordinarios para protestar por cosas que ahora si le parecen importantes. Es lo que dice el 97% de los casos, así que ni tan mal.

b) navegar por una web supone formalizar un contrato, sí o no.

Ryanair, como Marca, como mucha gente, prohíbe en sus condiciones el screen scraping en su web para uso comercial. Este argumento no fue aceptado ni por el primer juzgado ni por el segundo. El Supremo no entra a pelearse porque Ryanair tendría que haber protestado en otro recurso contra esto, pero le da una castaña alegando que ATRAPALO SL en ningún momento había aceptado los términos de uso de la web. No aceptation, no fun.

Pero entonces, ¿los términos y condiciones no valen para nada? Vamos a dejar una cosa clara: los términos y condiciones son las reglas del juego, la base de un contrato entre la web y tú como usuario. Hay que cumplirlos, pero para cumplirlos tienes que entrar a jugar. Si no llegas al campo da un poco igual si coges la pelota, ¿no? Es lo que se llama en legaler “cláusulas predispuestas” o “condiciones generales”.

En este caso concreto lo que dice el Supremo es que ATRAPALO S.L. cuando scrapea la web de Ryanair no ha aceptado los TyC, por lo que navega por la web como cualquier otro internauta. Se deduce que para evitar este comportamiento, vía de hecho, lo que tenía que haber hecho Ryanair es implementar una medida técnica que bloquease el acceso a los datos de precios y horarios de vuelo si no se aceptaban previamente las condiciones. Aunque este tipo de ventanas emergentes tampoco permiten usar la web sin aceptar las condiciones….

El Supremo tampoco acepta el argumento de Ryanair de que navegar es aceptar el contrato basándose en lo que dijo antes el Tribunal Superior de Irlanda, concretamente el 26 de febrero de 2010 en el asunto Ryanair vs. BiIIigfluege. Para los irlandeses precisamente navegar es aceptar el contrato y por tanto las partes se encuentran obligadas por los términos del contrato, y punto. Autores como Fernando Carbajo Cascón consideran que esto es un reflejo de las diferencias existentes entre el derecho anglosajón y el derecho continental.

c) Las bases de datos

Otro argumento low cost de Ryanair en su recurso era la vulneración de normas que protegen las bases de datos, partiendo de que su sistema de reserva de billetes es una base de datos. Para apoyar este argumento trae a colación la resolución de la Corte Regional de Hamburgo, Ryanair vs. Cheapticket que en su sentencia de 26 de febrero de 2010 (sí, es la misma fecha) reconoce la base de datos como susceptible de protección por los derechos de autor y por la vía del llamado derecho sui generis. De nuevo una diferencia notable entre legislaciones, y un ejemplo de conceptos vacíos que hay que interpretar. Sui generis es el criterio del legislador, que pesados.

En nuestra legislación se define base de datos en la ley de propiedad intelectual, artículo 12.2, de la siguiente e incomprensible manera: “…colecciones de obras, de datos, o de otros elementos independientes dispuestos de manera sistemática o metódica y accesibles individualmente por medios electrónicos o de otra forma.” Oh yeah.

Pensemos que somos Ryanair y que sí tenemos una base de datos de precios y billetes de avión. Para que se aplique la protección a la base de datos vía de los derechos de autor es necesario entender que la base de datos es una obra original. En relación a lo que se debe entender por original, el Tribunal de Justicia de la Unión Europea en la sentencia de 1 de marzo de 2012, C-604/10, Football Dataco adoptó una posición que reduce las situaciones en las que el calendario de una competición deportiva puede beneficiarse de tal protección, por ejemplo. Esa base de datos sería original en la medida en que la persona encargada de elaborarla tuviese libertad creativa a la hora de integrar los datos.

En cambio, el derecho sui generis que regula la Ley de Propiedad intelectual supone la “protección de la inversión sustancial, evaluada cualitativa o cuantitativamente, que realiza su fabricante ya sea de medios financieros, empleo de tiempo, esfuerzo, energía u otros de similar naturaleza, para la obtención, verificación o presentación de su contenido”.

Esta protección significa que el fabricante tiene la posibilidad de prohibir la extracción y/o reutilización de su contenido siempre que “la obtención, la verificación o la presentación de dicho contenido representen una inversión sustancial desde el punto de vista cuantitativo o cualitativo”. Oh yeah. Aleluyah. En humano, que puedo prohibir que me scrapees la web si me ha costado pasta montarla u obtener la información que contiene.

El tribunal de primera instancia en España le dijo a Ryanair que no había base de datos, por tanto ya no entra a analizar si se pudo haber producido la vulneración de sus derechos. Sin embargo, en otro de los juicios que Ryanair tuvo con agencias de viajes online el juez entendía que sí existía una base de datos pero con dos precisiones:

  1. No se podía considerar como original, por tanto sólo podría protegerse por derecho sui generis.

  2. La acción de entrar en la base de datos de Ryanair y comprobar horarios y precios de los vuelos era algo que no podía entenderse como grave, es decir, atendiendo al volumen de negocio de Ryanair: el número de consultas y posteriores reservas, que siempre se hacían en la web de Ryanair aún cuando luego las agencias cobraban una comisión, no era relevante.

En mi opinión, esta interpretación en un error, básicamente porque la única finalidad de acceder a la base de datos de Ryanair es comprobar los vuelos (horarios, precios y destinos), y eso comprende la totalidad del objeto comercial de la empresa. Y por otro lado si una agencia online es capaz de generar un tráfico muy elevado,sí que está causando un perjuicio importante a Ryanair. Por ej, pongamos que logra que sus clientes hagan 30000 reservas en un mes, el volumen de dinero obtenido en comisiones es importante y perjudica a Ryanair, que pretende vender más servicios a sus clientes con la siguiente estrategia: si mis vuelos son más baratos, tienes más dinero para comprarme otras cosas, como por ejemplo alquiler de habitaciones o de coches. Y por qué no decirlo, si agoto pronto los billetes baratos luego tendré que sacar a la venta antes de tiempo los caros y me fastidias mi estrategia comercial. No me interesa que vendas mis billetes en tu web, maldito ATRAPALO SL.

Para el Supremo no existe una base de datos, porque en primera instancia se declara que no la hay y el Supremo se ve obligado a asumir ese mismo hecho, porque como dijimos en el apartado a) si estabas atento, el recurso de casación no tiene por objeto una revisión de los hechos.

Aún adelantando esto el Tribunal explica pormenorizadamente los requisitos para que exista una base de datos y la protección por la vía de los derechos de autor o del derecho sui generis; finalizando su razonamiento al entender que no concurren los requisitos para aplicar ninguna de esas dos vías.

d) Competencia desleal

El Tribunal Supremo sintetiza toda la argumentación de Raynair sobre una presunta competencia desleal de ATRAPALO S.L en el párrafo 55 de su sentencia. Si, amigas y amigos, párrafo 55. Sólo para los que buscan la verdad al completo, y que se hayan leído los 54 anteriores. Te lo resumimos:

– para Ryanair las agencias online ganan dinero a su costa sin hacer nada, son unos parásitos, se aprovechan de sus bajos precios para conseguir que la gente reserve vuelos de Ryanair y cobrar una comisión por no hacer nada más que redireccionar.

– además, con este “viaje” las agencias de idem evitan que los usuarios accedan a las otras ofertas de Ryanair , que forman parte de su estrategia comercial en la web.

Para el Supremo, como no existe una base de datos, ni extracción de datos porque no hay base de datos, la agencia es una intermediaria a cambio de una comisión que redirecciona a sus clientes a la web de Ryanair sin hacer daño a gatitos, ni a Ryanair.

Conclusiones que sacamos del asunto Ryanair vs. ATRAPALO y sus dimensiones europeas,

  1. El screen scraping en principio es lícito, y legal dependiendo de los términos y condiciones de la web. Léetelos, es importante.

  2. Con carácter general el screen scraping no está autorizado en las páginas web. En serio, léetelas.

  3. Si se prohíben para actividades comerciales, habría que saber a qué se refieren. Si no gano dinero con el scrapping ni hay ánimo de lucro, como cuando hablábamos de las apps oficiales y las apps de particulares, no debería perseguirse.

  4. Los TyC tienen la consideración de condición general de la contratación, porque son cláusulas que ya vienen impuestas a los usuarios sin posibilidad de negociarlas previamente. Esto no significa que todas sean correctas. Que las leas.

  5. Para que los TyC web sean plenamente eficaces, las webs deberían establecer algún medio técnico que no permita navegar o usar la web si previamente no los has aceptado expresamente. De hecho, los cambios normativos que se avecinan ya huelen a consentimiento expreso, pero esto, amigas y amigos y amigas, ya es otra historia.

Si te ha gustado este post ayuda a su difusión:

This website uses cookies to give you the best user experience. If you continue browsing you are giving your consent for the acceptance of the aforementioned cookies and the acceptance of our cookies policy, click the link for more information.plugin cookies

ACEPTAR
Aviso de cookies