- Story
Partager ses données pour plus de durabilité
21.06.2023 Il est souvent difficile de connaître les déplacements des individus. Pour les découvrir, il faut disposer de données suffisamment précises, mais qui ne permettent pas d’identifier les personnes concernées. Un projet de la BFH cherche des solutions à ce casse-tête.
Use case: une foule de données, mais pas celles qu’il faut
Une ville s’engage pour une mobilité plus durable. Elle aimerait notamment savoir si elle devrait prévoir davantage de pistes cyclables et recherche une base de décision irréprochable du point de vue de l’éthique et de la protection des données.
Les smartphones sont évidemment une mine d’informations sur le comportement de la population en matière de mobilité. Mais ces données se trouvent le plus souvent chez les grandes entreprises de technologie et ne sont pas accessibles pour la ville de notre exemple, ou ne sont pas disponibles dans une résolution suffisante. Il manque tout simplement des données brutes pour les projets comme celui-ci, qui analyse la mobilité en faveur de la durabilité.
Nouveau: modèle commercial coopératif
Chercheuse à la BFH, Annett Laube relève le défi en collaboration avec Posmo, coopérative de données pour une mobilité durable. Posmo recueille et gère des informations sur le comportement en matière de mobilité afin de promouvoir des solutions durables dans ce domaine. Les données sont traitées par le biais d’une coopérative. «Les coopérateurs et coopératrices partagent volontairement leurs données pour améliorer la durabilité», explique Annett Laube.
Les personnes utilisant Posmo gardent en tout temps le contrôle sur l’usage qui est fait de leurs données. Elles sont indemnisées directement lorsqu’une cliente comme la ville que nous évoquions tire profit des résultats obtenus à partir de ces données. Un modèle commercial à l’opposé du principe courant aujourd'hui de l’échange implicite de données personnelles contre l'utilisation d’une appli ou de services «gratuits».
Le défi: la crédibilité
La crédibilité est la clé du succès, souligne Annett Laube. «Il faut respecter la gouvernance éthique et éviter absolument tout usage abusif des données.» Il appartient au comité d’éthique de Posmo de déterminer si une requête de la clientèle est recevable. «Nous développons les processus et les éléments décisionnels nécessaires pour permettre à cet organe de remplir efficacement sa mission», ajoute Annett Laube. À l'avenir, ces bases de décision seront établies de façon automatique.
Il va de soi que la prudence est de mise avec des données de mobilité telles que celles fournies par les membres de la coopérative Posmo. L’application relève un point GPS toutes les dix secondes, ce qui permet d’établir des profils de déplacement très précis, mais rend les personnes facilement identifiables. C’est pourquoi il ne sort du pool de données Posmo aucune donnée brute, mais uniquement des résultats sélectionnés, agrégés et anonymisés.
La solution: l’anonymat dans la mêlée
L’anonymisation des données sensibles constitue en toute logique la préoccupation principale d’Annett Laube: «Aucun point ne doit être présenté hors d’un ensemble de données synthétisées». Il s’agit d’un set de données mêlées protégeant l’anonymat des utilisateurs et utilisatrices de Posmo, car aucun point ne sort du lot ni n’est identifiable.
Si un set de données ne fonctionne pas comme un ensemble «entremêlé», il est traité pour s’assurer qu'aucun individu ne puisse être identifié. Plusieurs moyens le permettent: sélection des données, agrégation, réduction du bruit des données de position, choix de données temporelles moins précises, etc.
Les concepts et les algorithmes développés à la BFH aident Posmo à décider à quel moment les volumes de données sont suffisamment grands et «entremêlés» pour autoriser un traitement sans risque des résultats. À cet effet, Annett Laube et son équipe recourent à des mécanismes d’anonymisation courants comme la K-anonymisation et la méthode L-diversité pour rendre utilisables les profils de déplacement et les analyses qui en découlent.
La cible: la théorie générale de l’anonymat
Selon la question à étudier, l’équipe doit adopter une autre procédure pour l’anonymisation des données. Annett Laube donne l'exemple d'un projet à Zurich: «Une recherche portant uniquement sur le moyen de transport utilisé semble anonyme et sans danger. Mais il suffit qu’une personne du set de données prenne le Polybahn pour qu'il y ait un risque d’identification. Il n'y a donc pas d’anonymat général.»
Annett Laube et son équipe recherchent par conséquent des solutions pour formaliser et automatiser des mécanismes et des procédures d’anonymisation. Ces travaux s’inscrivent dans un projet d’Innosuisse qui s’étend jusqu’à l’été 2024.