Chaine de confiance : des données partagées en transparence et sécurité
Que ce soit pour la recherche et l’innovation, un groupe d’agriculteurs, une coopérative, ou encore un prestataire de services, le partage des données - agronomiques ou technico-économiques - issues d’une exploitation agricole pose la question de la maitrise et de la protection de ces données, souvent accompagnées d’informations personnelles. Sans anonymisation, l’utilisation de données à caractère personnel implique le consentement des agriculteurs et agricultrices et la mise en place d’outils adaptés à la gestion de ce consentement.
Des chartes pour compléter le droit
À ce jour, il n’existe aucun droit de propriété sur les données. Leur caractère « non rival » et reproductible empêche toute forme d’appropriation juridique. Par ailleurs, il n’existe pas de droit spécifique qui viendrait régir la maitrise ou l’usage des données en général. Pourtant, le droit des bases de données peut constituer un obstacle à la circulation des données. Lors de l’exploitation des données agricoles, la présence de données personnelles doit, en toute circonstance, faire l’objet d’une attention particulière.
Les données sont en général organisées dans une base de données. En cas d’investissement substantiel lors de l’obtention, la vérification ou la présentation du contenu de la base (d’un point de vue qualitatif ou quantitatif), le droit sui generis des bases de données octroie un monopole d’exploitation sur les données au producteur de la base. À ce titre, le producteur peut interdire l'extraction et la réutilisation de la totalité ou d'une partie du contenu de la base de données.
D’une manière générale, c’est dans le contrat encadrant les relations entre l’exploitant agricole et le tiers collectant que sont réglées les conditions d’accès des données. Ainsi, les acteurs qui ont les moyens techniques et financiers de collecter de grandes quantités de données peuvent en limiter l’accès et la circulation, et se rendre responsables de comportements prédateurs, notamment du fait de leur position. Cela fait peser un risque de concentration de l’innovation et peut avoir des effets sur le libre jeu de la concurrence.
Les acteurs du monde agricole ont donc cherché à rétablir ce déséquilibre en proposant un cadre de bonnes pratiques d’utilisation de ces données, renforçant la confiance nécessaire aux échanges. Un droit souple (soft law) matérialisé par des chartes s’est élaboré autour de la rédaction des contrats, d’abord aux états-Unis, avec le Farm Bureau (39 associations et entreprises de l’agrofourniture signataires de la charte « Privacy and Security Principles for Farm Data »(1)), puis en France (charte « DataAgri » de la FNSEA et des JA) et en Europe (avec la Copa-Cogeca, plusieurs syndicats agricoles ont rédigé un code de conduite sur le partage des données dans le secteur agricole). Ce droit souple présente l’avantage de compléter un cadre juridique lacunaire mais il n’est pas contraignant juridiquement. Le non-respect de la charte pourra, en revanche, avoir des conséquences sur le plan commercial ou de la réputation, pouvant justifier l’exclusion d’une communauté.
Une nécessaire protection des données personnelles
Si les données collectées et traitées se rapportent à une personne physique identifiée ou identifiable, et ce peu importe le contexte de la collecte, professionnel ou personnel, le règlement général sur la protection des données s’applique (RGPD). En revanche, lorsqu’elles sont non personnelles - par exemple, les données industrielles générées par des machines agricoles - les données restent de « libre parcours », elles ne sont pas réglementées.
La seule limite entre les données personnelles et non personnelles tient au caractère raisonnable des moyens de traitement utilisés pour identifier la personne physique. Ainsi, dans le cadre d’une exploitation individuelle, les données de géolocalisation d’un tracteur associées à un numéro de plaque d’immatriculation ou au numéro de série du véhicule pourront constituer des données à caractère personnel (Cour de cassation et CNIL(2)). Les personnes morales sont en revanche exclues du champ d’application des données personnelles sauf si, à travers elles, des personnes physiques sont identifiables de manière incidente.
En ce qui concerne ses données personnelles, toute personne a divers droits qu’elle peut faire valoir auprès du « responsable de traitement », tels que le droit à l’oubli, les droits d’accès et de rectification ou encore le droit à la portabilité. Le « responsable de traitement » est soumis, entre autres, à des obligations d’information sur les traitements réalisés. Il doit également veiller au respect de règles empêchant l’utilisation de ces données à d’autres fins que celles prévues lors de la collecte, sauf accord explicite de la personne concernée.
La plupart des données agricoles d’intérêt pour la recherche entrant dans le champ du RGPD, il y a lieu de proposer des solutions pour maitriser le risque juridique lié à leur exploitation. Il est ainsi possible d’anonymiser les données afin de les valoriser. Si l’accès à des données non anonymisées est nécessaire, il faut, pour respecter les obligations règlementaires et les principes des chartes, demander le consentement de la personne concernée.
Ce qui se cache derrière l’anonymisation
D’un point de vue juridique, l’anonymisation est le fait de rendre anonymes les données de telle manière que la personne ne soit pas ou plus identifiable. Les méthodes d’anonymisation sont irréversibles, de sorte qu’elles doivent empêcher tout risque de ré-identification des personnes physiques. Le résultat de l’anonymisation doit être aussi permanent qu’un effacement. Cette technique exclut ainsi les données du champ d’application de la règlementation sur les données personnelles.
La règlementation européenne préconise au minimum de « pseudonymiser » les informations personnelles. La pseudonymisation rend possible la ré-identification des données seulement si on connait la méthode de ré-identication pour un jeu de données précis (et si on est autorisé à l’utiliser). Si on ne connait pas cette méthode, il devient alors impossible de ré-identifier les données, même par croisement avec d’autres sources d’information.
Un exemple de méthode de pseudonymisation consiste à diviser une source de données en deux parties (tableau 1). Dans une première partie, on conserve les informations identifiant directement les personnes. On associe à chaque enregistrement un code (une « clé »). Cette partie des données est conservées en toute sécurité par le détenteur initial des données personnelles. Dans une seconde partie des données, on ne fait figurer que la clé et les autres informations lesquelles on souhaite travailler. Cette seconde partie des données rend possible, par exemple, le calcul des sommes des surfaces agricoles utiles sans avoir accès aux données personnelles.
Une autre technique consiste à ajouter du « bruit » grâce à de nouvelles valeurs qui diminuent les possibilités de rapprochement avec les données personnelles. Le traitement des données doit en tenir compte et, bien sûr, ne pas en être impacté.
La méthode la plus classique pour garantir l’anonymisation des données est la réduction du niveau de détails. Le principe consiste à créer un jeu de données à un niveau de détail plus général que la source de données originale, en enlevant ou en remplaçant les données personnelles. Par exemple, la valeur d’un champ de la base de données présentant des noms de particuliers prendra la valeur « PARTICULIER » ; on supprimera aussi les champs personnels des exploitants en ne laissant que des informations non identifiées (type d’exploitation, SAU, etc.). Il est possible de remplacer les informations de localisation (la commune des exploitations par exemple) par des informations moins détaillées, telles que le canton ou le département. Cette réduction du niveau de détail est souvent appelée généralisation - une représentation plus générale est alors produite.
Il faut toujours être vigilant sur le risque de ré-identication par recoupement avec d’autres sources. Des données géoréférencées, qui pourraient sembler anonymes, peuvent par recoupement permettre de retrouver un propriétaire par sa localisation. S’il n’y a qu’un producteur de chanvre dans un canton, on pourra facilement ré-identifier les données concernant le chanvre. Il faut alors réduire les données au niveau départemental, et ainsi de suite.
Quoiqu’il en soit, si les études à mener nécessitent des données détaillées, il faut obligatoirement solliciter le consentement des exploitants.
Le consentement en toute sérénité
Le consentement est défini comme « toute manifestation de volonté, libre, spécifique, éclairée et univoque par laquelle la personne accepte par une déclaration ou par un acte positif clair que des données à caractère personnel fassent l’objet d’un traitement » (CNIL). C’est l’une des six bases légales() sur lesquelles repose un traitement de données personnelles. Mais les chartes agricoles préconisent d’élargir la demande du consentement à toutes les données de l’agriculture numérique.
Pour répondre aux attentes des agriculteurs, les partenaires du projet CASDAR Multipass (encadré) ont imaginé un écosystème interopérable de gestion des consentements des agriculteurs rendant aux producteurs la maitrise de leurs données. Lors d’ateliers MULTIPASS avec des agriculteurs en 2018, ceux-ci avaient exprimé le souhait de mieux identifier les flux et les acteurs, de même que les usages et les données concernées (organisés dans une typologie). La gestion des consentements repose sur des outils qui stockent les consentements, et facilitent leur écriture et leur consultation. Ces systèmes de gestion des consentements (SGC) permettent également de révoquer un consentement simplement, c'est-à-dire qu’il peut être retiré de la même manière qu’il a été donné. L’outil au cœur de l’écosystème proposé est un routeur qui garantit l’interopérabilité des différents SGC. Le routeur unifie l’accès aux SGC en partageant une définition d’un consentement qui doit être caractérisé par les acteurs de l'échange de données, la nature de l'échange (type de données, usages), la portée du consentement et d’éventuelles restrictions. Ces caractéristiques sont basées sur des référentiels partagés qualifiant les types de données et les types d’usage.
MULTIPASS : de nouveaux services à la cléÀ travers ce projet financé par le ministère de l’Agriculture (CASDAR), les partenaires (Arvalis, ACTA, FIEA, Idele, INRAE, Orange et SMAG) souhaitent mettre à disposition des producteurs et des valorisateurs de données agricoles, un écosystème de gestion des consentements des agriculteurs protégeant les échanges de données des exploitations. Le projet vise à démontrer aux organisations professionnelles agricoles l’intérêt et la faisabilité d’un tel écosystème. Il a vocation à couvrir les besoins de transparence des usages et de gestion des consentements de toutes les filières agricoles. En renforçant la confiance des producteurs, nécessaire au partage de leurs données, le projet devrait faire émerger de nouvelles connaissances et de nouveaux services. Plus de précisions sur le site https://numerique.acta.asso.fr/multipass
Le routeur dispose de deux principales fonctionnalités. La première est de lister les consentements (par ayant droit, par bénéficiaire, etc.) afin de donner à chaque acteur une vision exhaustive (transparente) des consentements qui peuvent être distribués sur plusieurs SGC. La deuxième est de vérifier la présence d’un consentement valide dans un des SGC qu’il connait, avant un échange de données, pour respecter la chaine de confiance.
La gestion des consentements ne lèvera pas pour autant les stratégies individuelles de limitation de la circulation des données. Ce type d’outil est aussi un moyen pour les agriculteurs de s’exprimer sur les options de mise en circulation qui lui sont offertes. Le consentement sera facile à obtenir dans le cas où l’exploitant obtient un service direct du partage de ses données - par exemple, éviter une ressaisie pour valoriser ses données dans un nouvel outil.
Toutefois, l’obtention du consentement en vue d’un recueil de données massives pour la recherche peut s’avérer délicate. Les nombreuses sollicitations que recevraient les agriculteurs pourraient lasser ou inspirer la méfiance. De plus, les taux de retour standards dans la plupart des enquêtes sont relativement faibles. Il semble plus adapté dans ce cas de travailler sur une approche plus globale qu’individuelle (auprès de groupes d’agriculteurs, via les éditeurs de logiciels de gestion parcellaires et les organismes stockeurs par exemple). Un partenariat avec les éditeurs reste obligatoire afin d’accéder aux bases de données et d’assurer l’interopérabilité des systèmes d’information.
Par ailleurs, l’anonymisation et la gestion du consentement n’interfèrent pas avec la manière dont les opérateurs valorisent économiquement les données (prestations de services...).
(1) www.fb.org/issues/innovation/data-privacy/privacy-and-security-principles-for-farm-data
(2) Commission Nationale Informatique et Libertés
(3) www.cnil.fr/fr/la-liceite-du-traitement-lessentiel-sur-les-bases-legales-prevues-par-le-rgpd
Laura Tomasso - laura.tomasso@umontpellier.fr
Bruno Lauga - b.lauga@arvalis.fr
François Pinet - francois.pinet@inrae.fr
0 commentaire
Réagissez !
Merci de vous connecter pour commenter cet article.