Quelles sont les limites du web scraping ?
19 octobre 2021.
Un moteur de recherches qui réalisait une activité de référencement d’annonces a été condamné à une indemnité de 50 000€. Les juges ont estimé que l’extraction excessive d’annonces provenant d’une base de données en ligne constituait une atteinte au droit sui generis de producteur de base de données.¹
Que s’est-il passé ?
=> En préambule, qu’est-ce que le “Web Scraping” ?
C’est l’action d’extraire du contenu de site internet avec l’aide d’un outil, d’un programme ou un script afin d’utiliser les données récupérées pour une utilisation autre, tel que par exemple le référencement.
1/ Le droit de la protection des bases de données, quelles sont les spécificités ?
Cette décision est l’occasion de revenir sur un droit de propriété intellectuelle assez peu connu…
Une base de données est un recueil d’œuvres, de données ou d’autres éléments indépendants, disposés de manière systématique ou méthodique, et individuellement accessibles par des moyens électroniques ou par tout autre moyen.
Constituant un actif immatériel de plus en plus présent dans notre société, il peut faire l’objet de deux régimes de protection différents et autonomes :
- Le droit d’auteur classique qui protège le contenant, la structure de la base de données : Ici, le critère de l’originalité joue, et la protection s’appliquera donc uniquement si le choix ou la disposition des données témoigne d’une activité créative.
- Un droit spécial (dit « sui generis ») qui protège le contenu de la base de données : Pour bénéficier de ce régime, il est nécessaire d’avoir réalisé un investissement. Cet investissement doit lui-même respecter certaines conditions :
- être substantiel quantitativement et/ou qualitativement ;
- financier, matériel ou humain ;
- doit permettre la constitution, la vérification ou la présentation du contenu de la base de données.
La réutilisation de bases de données préexistantes n’est donc pas libre. Il convient d’être vigilant à l’égard des droits qui les protègent.
2/ Que s’est-il passé ?
La société Groupe la Centrale édite un site internet dédié aux annonces de véhicules d’occasion destiné au public. En plus de référencer les annonces, de nombreux renseignements sur les véhicules (marque, modèles, prix, kilométrage, localisation…) sont ajoutés. L’ensemble de ces informations sont collectées, vérifiées et indexées par le groupe lui-même.
Cette société a décidé de poursuivre un éditeur de moteur de recherche regroupant des annonces publiques disponibles sur d’autres sites tel que celui de la Centrale. Son ambition est de faciliter les recherches des internautes en créant un accès unique aux annonces.
Cette activité s’appelle le « web scraping ». Il s’agit d’extraire des informations sur différents sites internet et les réutiliser dans un contexte différent. Ce type d’applications de scraping rencontre souvent un grand succès.
Estimant que le moteur de recherche porterait atteinte à son droit de producteur sur les bases de données, et que cette activité constituerait également un acte de parasitisme, l’entreprise a intentée une action devant le Tribunal judicaire de Paris le 8 juillet 2021.
3/ La décision des juges
Les juges qualifient la Centrale de « producteur de base de données ». En effet, elle relève que la société a apporté la preuve d’investissement financiers et humains substantiels quantitatif et qualitatif : conclusion de contrats de prestations informatiques avec des sociétés externes, embauche de salarié pour le développement du système de collectes d’annonces, conclusion de contrats de fournitures de services pour la création de l’interface de la base de données, embauche d’un salarié pour vérifier l’exactitude des données…. Au total, la société justifie d’investissements s’élevant en moyenne à 1,5 million d’euros par an.
Il bénéficie ainsi des prérogatives du droit sui generis du producteur de base de données notamment la possibilité d’interdire :
- L’extraction, par transfert permanent ou temporaire de la totalité ou d’une partie qualitativement ou quantitativement substantielle du contenu d’une base de données sur un autre support, par tout moyen et sous toute forme que ce soit ;
- La réutilisation, par la mise à la disposition du public de la totalité ou d’une partie qualitativement ou quantitativement substantielle du contenu de la base, quelle qu’en soit la forme ;
Selon la Cour de justice de l’Union européenne, la notion de « partie quantitativement substantielle » se réfère au volume de données extrait ou réutilisé par rapport au volume total des données contenues dans la base.
Le tribunal constate une atteinte de l’éditeur aux droits de la société par l’extraction et la réutilisation d’une partie importante du contenu de sa base de données. Ayant subi un préjudice de cette perte de trafic, elle condamne l’éditeur au paiement de 50 000€ de dommages et intérêts.
Il y a donc lieu d’être particulièrement vigilant aux pratiques de web scraping.
4/ Que faut-il retenir ?
- Le contenu des bases de données est protégé par un droit sui generis quand elle résulte d’un investissement financier, matériel ou humain, substantiel quantitativement et/ou qualitativement permettant la constitution, la vérification ou la présentation du contenu de la base de données.
- Ce droit permet à son producteur d’interdire l’extraction et l’utilisation de la totalité ou d’une partie qualitativement ou quantitativement substantielle du contenu de la base.
- La pratique de web scraping peut être sanctionnée à titre d’atteinte aux droits du producteur de bases de données.
Claudia Weber, avocat fondateur et Ainhoa Ammirati, juriste | ITLAW Avocats
¹ Arrêt du 8 juillet 2021 – Tribunal judiciaire de Paris
Besoin d’aide pour y voir plus claire sur le droit des bases de données ?
ITLAW Avocats met à votre service son expérience et son expertise en matière de propriété intellectuelle, en particulier s’agissant du droit des bases de données.
ITLAW Avocats vous accompagne pour défendre vos pré-contentieux, contentieux, en attaque comme en défense en mobilisant ses talents et son expertise en matière de contrats, d’innovation, de projets informatiques complexes, de protection des données personnelles et de propriété intellectuelle ainsi que sa connaissance de l’écosystème IT pour vous accompagner dans la sécurisation de votre patrimoine intellectuel, y compris en cas de contrefaçon !
Nous contacter