Depuis que je suis confiné, mon domicile et mon travail étant colocalisé, et ceci étant valable pour deux personnes (et nous ne sommes pas collègues), je suis trop bien anonymisé, ils ne sauront jamais lequel des deux je suis.
bah non, si j'ai 10, 100, 1000 trajets différents je ne saurais toujours pas lequel est le tien. Je ne saurai toujours pas où toi, gUI, tu habites, ni ton nom.
Posté par gUI (Mastodon) .
Évalué à 6.
Dernière modification le 27 mars 2020 à 19:24.
ah mais c'est pas là le pb.
c'est que si tu as accès à toute la base de donnée, que un cas t’intéresse (qqu'un qui est allé aux putes mardi soir, ou qui n'a pas respecté le confinement en quittant Paris), il sera très facile de savoir qui c'est, et d'y mettre un nom. ce sont donc des données permettant l'identification d'une personne.
tu verras que cette personne est l'identifiant anonymisé n°5421365. mais tu verras aussi que cette personne habite au "12 rue de la maison" et travaille au "34 rue du boulot", bref moi (et pas ma femme puisqu'elle travaille ailleurs).
il n'y a rien d'anonyme quand on suit une trace d'une personne sur une longue durée.
En théorie, la théorie et la pratique c'est pareil. En pratique c'est pas vrai.
il sera très facile de savoir qui c'est, et d'y mettre un nom.
Vas y, dis moi comment faire.
Bon on va s'arrêter là mais j'espère que tu as compris où je voulais en venir. Désanomymiser n'est pas trivial, ni possible dans tous les cas.
Il est peut être plus efficace de suivre physiquement la personne qui nous intéresse (pour voir le nom sur sa boite aux lettres, etc).
Mais là on parle de la mise à disposition à un groupe de chercheurs pour les besoins d'étude sur la propagation d'un virus. Ils ont très certainement une conscience et une éthique professionnelle et d'autres choses à faire que de désanonymiser les trajets. D'ailleurs, autant qu'ils aillent dans la rue et relever les noms sur les boites aux lettres.
Et ca se trouve, les données seront rendues moins précises donc quasi inexploitablse pour recibler quelqu'un.
Cet argument ne va pas. C'est pas parce que tu as trouvé un cas où ça ne pose potentiellement pas de problème que c'est bon. Au contraire, c'est en trouvant un cas où on peut facilement identifier une personne que c'est problématique. C'est déjà arrivé. Il y a avait un journaliste qui avait relevé le défi à partir de données anonymisées, il a écrit un article où il décrit la vie d'une personne à partir de ses données. Il y avait aussi eu des histoires à propos d'AOL qui diffusait les recherches de ses abonnés de manière «anonymisée».
Sinon:
(…) les chercheurs ont montré qu'un individu pouvait être retrouvé (…) dans une base de données téléphoniques sur base de quatre points de géolocalisation.
Le bimestriel «Le Tigre» a réalisé un «portrait google» d'une personne prise au hasard, en retraçant sa vie à partir des informations qu'il avait laissées sur le web
Un article de 2009, où le journaliste a compilé toutes les infos données par la personne en question sur les réseaux sociaux.
J'espère que depuis, les gens ont plus conscience de tout cela, et font plus attention.
Donc parce qu'il y a des abus à la fois par ceux qui donnent des informations et par ceux qui en récoltent, les chercheurs n'ont pas le droit à des données "anonymisées" pour étudier la propagation d'un virus ?
Pour moi, le vrai risque est que ce jeu de données se retrouve dans la nature, pas dans les mains de ces chercheurs.
Et malheureusement, ces jeux existentent déjà et sont déjà exploités pour des buts bien moins nobles. Si ces jeux pouvaient rendre service au moins une fois à la société entière…
je critique ceux qui disent "c'est anonymisé", cet tout.
Ca l'est. Mais le problème, c'est qu'on peut casser cet anonymat, ca dépend d'abord de la qualité des données à l'origine et ensuite de l'envie et des moyens en face.
Un peu comme une lettre "anonyme", on peut chercher des indices et les croiser : on peut extraire l'ADN dessus, remonter à l'imprimante si elle a été imprimée, étude graphologique…
Une autre analogie. C'est comme si tu critiquais ceux qui disent que les mots de passe sont chiffrés. Ils le sont, mais la "facilité" de décryptage d'un mot de passe va dépendre de l'algorithme de chiffrement et des moyens de chiffrements que tu vas mettre en face.
Et encore une fois, est-ce que cela en vaut le coup/coût ?
Posté par gUI (Mastodon) .
Évalué à 3.
Dernière modification le 28 mars 2020 à 07:30.
Je ne suis pas du tout d'accord avec la première partie de ta réponse, tout est question de moyens. J'y vais, j'ai son nom sur la boite aux lettres, et je fais la relation entre cette personne et l'événement (non respect du confinement par exemple) qui t'a fait regarder cette personne particulièrement puisque c'est de ça dont il s'agit, pas d'avoir une liste de noms et d'adresse, on s'en branle suffit de lire l'annuaire.
Par contre si tu me files une liste d'adresses IP qui accèdent à du contenu illicite par exemple, j'en ferai pas grand chose. Il me faut des informations en plus que seul le FAI possède (quelle IP à quel moment par quelle personne). Je verrais facilement que c'est un client SFR de tel quartier Parisien, mais c'est tout.
Et ca se trouve, les données seront rendues moins précises
Là oui on peut espérer.
En théorie, la théorie et la pratique c'est pareil. En pratique c'est pas vrai.
Tu prends la liste des gens qui habitent dans la zone de ton premier lien, la liste des gens qui travaillent dans la zone de ton second lien et tu as ta personne.
S’il y a plusieurs personnes, tu prends une troisième zone (celle sur laquelle tu enquêtes par exemple) et tu compare les listes des trajets (aller-retours) de zone 1 vers zone 2, zone 2 vers zone 3 et zone 3 vers zone 1.
Mais en même temps, ça c’est seulement si tu cherches à déterminer l’identité exacte d’une personne, dans la réalité il suffit d’être au mauvais endroit au mauvais moment pour être suspect.
# Anonymiser les données de géolocalisation
Posté par gUI (Mastodon) . Évalué à 8. Dernière modification le 27 mars 2020 à 14:37.
Les données de géolocalisation anonymisées c'est toujours comique.
Voyons, combien de personnes sont susceptibles de passer leurs nuits chez moi et d'aller en journée à l'adresse de mon travail ?
Environ une.
En théorie, la théorie et la pratique c'est pareil. En pratique c'est pas vrai.
[^] # Re: Anonymiser les données de géolocalisation
Posté par devnewton 🍺 (site web personnel) . Évalué à 7.
Moi deux, mais j'ai pas envie que ça se sache non plus !
Le post ci-dessus est une grosse connerie, ne le lisez pas sérieusement.
[^] # Re: Anonymiser les données de géolocalisation
Posté par gUI (Mastodon) . Évalué à 3.
Faut pas coucher avec les collègues !
En théorie, la théorie et la pratique c'est pareil. En pratique c'est pas vrai.
[^] # Re: Anonymiser les données de géolocalisation
Posté par Benoît Sibaud (site web personnel) . Évalué à 7.
Depuis que je suis confiné, mon domicile et mon travail étant colocalisé, et ceci étant valable pour deux personnes (et nous ne sommes pas collègues), je suis trop bien anonymisé, ils ne sauront jamais lequel des deux je suis.
[^] # Re: Anonymiser les données de géolocalisation
Posté par Ysabeau 🧶 (site web personnel, Mastodon) . Évalué à 10.
Mais sais-tu lequel des deux tu es ?
« Tak ne veut pas quʼon pense à lui, il veut quʼon pense », Terry Pratchett, Déraillé.
[^] # Re: Anonymiser les données de géolocalisation
Posté par Thomas Douillard . Évalué à 2.
En tout cas, nous, on sait pas qui poste.
[^] # Re: Anonymiser les données de géolocalisation
Posté par Axone . Évalué à 1.
Oui mais tu triches, tu sais comment tu t'appelles et où tu habites.
Moi, même en ayant accès aux données de localisation, je ne saurai toujours pas comment tu t'appelles, ni où tu habites.
[^] # Re: Anonymiser les données de géolocalisation
Posté par gUI (Mastodon) . Évalué à 3.
Ah si tu sauras où j'habite, avec la géolocalisation. Et du coup ce sera pas très très compliqué de savoir comment je m'appelle.
En théorie, la théorie et la pratique c'est pareil. En pratique c'est pas vrai.
[^] # Re: Anonymiser les données de géolocalisation
Posté par Axone . Évalué à 0.
bah non, si j'ai 10, 100, 1000 trajets différents je ne saurais toujours pas lequel est le tien. Je ne saurai toujours pas où toi, gUI, tu habites, ni ton nom.
[^] # Re: Anonymiser les données de géolocalisation
Posté par gUI (Mastodon) . Évalué à 6. Dernière modification le 27 mars 2020 à 19:24.
ah mais c'est pas là le pb.
c'est que si tu as accès à toute la base de donnée, que un cas t’intéresse (qqu'un qui est allé aux putes mardi soir, ou qui n'a pas respecté le confinement en quittant Paris), il sera très facile de savoir qui c'est, et d'y mettre un nom. ce sont donc des données permettant l'identification d'une personne.
tu verras que cette personne est l'identifiant anonymisé n°5421365. mais tu verras aussi que cette personne habite au "12 rue de la maison" et travaille au "34 rue du boulot", bref moi (et pas ma femme puisqu'elle travaille ailleurs).
il n'y a rien d'anonyme quand on suit une trace d'une personne sur une longue durée.
En théorie, la théorie et la pratique c'est pareil. En pratique c'est pas vrai.
[^] # Re: Anonymiser les données de géolocalisation
Posté par Axone . Évalué à 1.
Essayons, prenons ce cas de figure :
Un trajet récurrent montre que la personne habite là:
https://www.google.fr/maps/@48.9933651,1.717204,122m/data=!3m1!1e3
Et qui travaille là :
https://www.google.fr/maps/@48.9824629,1.860146,976m/data=!3m1!1e3
Vas y, dis moi comment faire.
Bon on va s'arrêter là mais j'espère que tu as compris où je voulais en venir. Désanomymiser n'est pas trivial, ni possible dans tous les cas.
Il est peut être plus efficace de suivre physiquement la personne qui nous intéresse (pour voir le nom sur sa boite aux lettres, etc).
Mais là on parle de la mise à disposition à un groupe de chercheurs pour les besoins d'étude sur la propagation d'un virus. Ils ont très certainement une conscience et une éthique professionnelle et d'autres choses à faire que de désanonymiser les trajets. D'ailleurs, autant qu'ils aillent dans la rue et relever les noms sur les boites aux lettres.
Et ca se trouve, les données seront rendues moins précises donc quasi inexploitablse pour recibler quelqu'un.
[^] # Re: Anonymiser les données de géolocalisation
Posté par ted (site web personnel) . Évalué à 3.
Cet argument ne va pas. C'est pas parce que tu as trouvé un cas où ça ne pose potentiellement pas de problème que c'est bon. Au contraire, c'est en trouvant un cas où on peut facilement identifier une personne que c'est problématique. C'est déjà arrivé. Il y a avait un journaliste qui avait relevé le défi à partir de données anonymisées, il a écrit un article où il décrit la vie d'une personne à partir de ses données. Il y avait aussi eu des histoires à propos d'AOL qui diffusait les recherches de ses abonnés de manière «anonymisée».
Sinon:
(…) les chercheurs ont montré qu'un individu pouvait être retrouvé (…) dans une base de données téléphoniques sur base de quatre points de géolocalisation.
Un LUG en Lorraine : https://enunclic-cappel.fr
[^] # Re: Anonymiser les données de géolocalisation
Posté par antistress (site web personnel) . Évalué à 4. Dernière modification le 28 mars 2020 à 00:07.
https://www.lefigaro.fr/secteur/high-tech/2009/01/15/32001-20090115ARTFIG00625-un-internaute-mis-a-nu-a-partir-de-ses-traces-sur-le-web-.php
Je pense que c'est ça ?
[^] # Re: Anonymiser les données de géolocalisation
Posté par Axone . Évalué à 0.
Un article de 2009, où le journaliste a compilé toutes les infos données par la personne en question sur les réseaux sociaux.
J'espère que depuis, les gens ont plus conscience de tout cela, et font plus attention.
[^] # Re: Anonymiser les données de géolocalisation
Posté par Ambroise . Évalué à 8.
J'avoue : j'ai ri
[^] # Re: Anonymiser les données de géolocalisation
Posté par ted (site web personnel) . Évalué à 2. Dernière modification le 29 mars 2020 à 09:19.
Voici ce dont je parlais:
https://en.wikipedia.org/wiki/AOL_search_data_leak
Ce sont des données divulguées volontairement par AOL et anonymisées.
Mais j'espère qu'aujourd'hui les gens font plus attention aux recherches qu'ils font.
Un LUG en Lorraine : https://enunclic-cappel.fr
[^] # Re: Anonymiser les données de géolocalisation
Posté par Axone . Évalué à 2.
Donc parce qu'il y a des abus à la fois par ceux qui donnent des informations et par ceux qui en récoltent, les chercheurs n'ont pas le droit à des données "anonymisées" pour étudier la propagation d'un virus ?
Pour moi, le vrai risque est que ce jeu de données se retrouve dans la nature, pas dans les mains de ces chercheurs.
Et malheureusement, ces jeux existentent déjà et sont déjà exploités pour des buts bien moins nobles. Si ces jeux pouvaient rendre service au moins une fois à la société entière…
[^] # Re: Anonymiser les données de géolocalisation
Posté par gUI (Mastodon) . Évalué à 5.
je critique pas les chercheurs du tout. je critique ceux qui disent "c'est anonymisé", cet tout.
En théorie, la théorie et la pratique c'est pareil. En pratique c'est pas vrai.
[^] # Re: Anonymiser les données de géolocalisation
Posté par Axone . Évalué à 2.
Ca l'est. Mais le problème, c'est qu'on peut casser cet anonymat, ca dépend d'abord de la qualité des données à l'origine et ensuite de l'envie et des moyens en face.
Un peu comme une lettre "anonyme", on peut chercher des indices et les croiser : on peut extraire l'ADN dessus, remonter à l'imprimante si elle a été imprimée, étude graphologique…
Une autre analogie. C'est comme si tu critiquais ceux qui disent que les mots de passe sont chiffrés. Ils le sont, mais la "facilité" de décryptage d'un mot de passe va dépendre de l'algorithme de chiffrement et des moyens de chiffrements que tu vas mettre en face.
Et encore une fois, est-ce que cela en vaut le coup/coût ?
[^] # Re: Anonymiser les données de géolocalisation
Posté par Anonyme . Évalué à 2.
J’ai évoqué Strava dans un autre commentaire, mais voilà un exemple de données anonymisées qui ont révélé beaucoup plus d’information que prévu.
[^] # Re: Anonymiser les données de géolocalisation
Posté par gUI (Mastodon) . Évalué à 3. Dernière modification le 28 mars 2020 à 07:30.
Je ne suis pas du tout d'accord avec la première partie de ta réponse, tout est question de moyens. J'y vais, j'ai son nom sur la boite aux lettres, et je fais la relation entre cette personne et l'événement (non respect du confinement par exemple) qui t'a fait regarder cette personne particulièrement puisque c'est de ça dont il s'agit, pas d'avoir une liste de noms et d'adresse, on s'en branle suffit de lire l'annuaire.
Par contre si tu me files une liste d'adresses IP qui accèdent à du contenu illicite par exemple, j'en ferai pas grand chose. Il me faut des informations en plus que seul le FAI possède (quelle IP à quel moment par quelle personne). Je verrais facilement que c'est un client SFR de tel quartier Parisien, mais c'est tout.
Là oui on peut espérer.
En théorie, la théorie et la pratique c'est pareil. En pratique c'est pas vrai.
[^] # Re: Anonymiser les données de géolocalisation
Posté par Anonyme . Évalué à 6.
Tu prends la liste des gens qui habitent dans la zone de ton premier lien, la liste des gens qui travaillent dans la zone de ton second lien et tu as ta personne.
S’il y a plusieurs personnes, tu prends une troisième zone (celle sur laquelle tu enquêtes par exemple) et tu compare les listes des trajets (aller-retours) de zone 1 vers zone 2, zone 2 vers zone 3 et zone 3 vers zone 1.
Mais en même temps, ça c’est seulement si tu cherches à déterminer l’identité exacte d’une personne, dans la réalité il suffit d’être au mauvais endroit au mauvais moment pour être suspect.
[^] # Re: Anonymiser les données de géolocalisation
Posté par Anonyme . Évalué à 5.
On dirait que l’histoire de Strava ne leur a pas suffit.
Suivre le flux des commentaires
Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.