MAT est un projet écrit en python dédié à l'anonymisation de metadonnées, se voulant simple d'utilisation. Écrit durant le GSoC 2011 sous l'ombrelle du projet Tor, il vient de sortir en version 0.3.2. Il est composé d'une bibliothèque, d'une interface en CLI, et d'une autre en GUI.
Qu'est-ce qu'une metadonnée ?
Une métadonnée est une information qui caractérise une donnée.
Prenons un exemple : lorsque vous créez un PDF, en général, des données additionnelles sont ajoutées à votre fichier : le nom du logiciel producteur, votre nom, la date de production, la description de votre document, le titre de votre document, la dernière date de modification, … ce sont des métadonnées. Vous n'avez peut-être pas envie de partager ces informations lorsque vous partagez votre fichier.
Formats pris en charge
Pour l'instant, MAT prend en charge les formats suivants :
- Portable Document Format (pdf)
- Zip
- TApe aRchiver (tar.gz, tar.bz2, tar)
- Jpeg (jpg, jpeg)
- Portable Network Graphics (png)
- Torrent
- Opendocuments (odt, opt, …)
- Openxml de Microsoft (docx, pptx, …)
- MPEG Audio (mp3, mp2, mpa, …)
- Ogg Vorbis (ogg)
- Free Lossless Audio Codec (flac)
Objectifs à long terme
Pour l'instant MAT permet l'anonymisation de quelques formats de fichiers couramment utilisés. Un des buts à long terme serait d'implémenter des contres-mesures pour le tatouage/marquage.
Aller plus loin
- Site officiel (1330 clics)
- Site de Tails (179 clics)
# m4a?
Posté par bob le homard . Évalué à 2.
Est-ce que cela fonctionne avec les données ajoutées par Apple lors d'un achat de fichier su iTunes?. Anéfé, Apple ajoute le nom de l'utilisateur + id unique à chaque fichier. Ce n'est pas un DRM mais il est aisé de tracer un tel fichier sur le réseau.
Korben avait donné une soluc qui fonctionne pas mal mais un peu lourde pour faire le ménage sur toute une bibliothèque :
http://korben.info/enlever-mouchards-itunes.html
# tatouage
Posté par Nicolas Boulay (site web personnel) . Évalué à 4.
C'est assez compliqué sans abimer le fichier. Le tatouage est de l'info rajouté inutile.
Si il ne se voit pas sur une image, cela veut dire qu'il suffit "d'optimiser le fichier" pour faire disparaitre les infos en plus. Si cela se voit, il faut compresser plus le fichier, virer/rajouter des lignes/colonnes pour faire du décalage dans la façon d'encoder le fichier et brouiller le message. Il faut sans doute jouer sur un filtre type anti-bruit mais qui rajoute aussi un peu de bruit (comme le dithering).
C'est difficile de faire un élément générique, surtout que cela deviendra l'étalon pour tester les nouveaux systèmes de tatouage.
"La première sécurité est la liberté"
# Anonymisation ?
Posté par Sam E. (site web personnel) . Évalué à 1.
Pour ceux qui se demanderaient ce que peut bien signifier «anonymiser des métadonnées», voici ce qui est dit sur la page du projet :
Ce que je traduis par :
[^] # Re: Anonymisation ?
Posté par 🚲 Tanguy Ortolo (site web personnel) . Évalué à 2.
Texte brut en français.
[^] # Re: Anonymisation ?
Posté par Sam E. (site web personnel) . Évalué à 1.
Oui, j'ai voulu éditer, mais trop tard …
[^] # Re: Anonymisation ?
Posté par gnuzer (site web personnel) . Évalué à 2.
Soyons fous : « plain-texte ».
[^] # Re: Anonymisation ?
Posté par sebas . Évalué à 1.
Ou alors "Texte de plaine" ?
Attention quand on met du plain-text dans une mounted unit (unité de montagne)
[^] # Re: Anonymisation ?
Posté par Benoît Sibaud (site web personnel) . Évalué à 3.
On peut faire de la stéganographie avec du texte, donc dissimuler dedans des données personnelles ou des métadonnées.
[^] # Re: Anonymisation ?
Posté par usermind42 . Évalué à 0.
Personnellement je conseil de chiffrer avec openssl au lieu d'utiliser la stégano seul… Aujourd'hui il y a de vrai hachoir a donnée dans les cables… (par lequelle transite toutes nos données…les vicieux nous vois très bien d'ou ils sont avec leurs super équipement…)
pour ceux qui souhaitent savoir pourquoi la stégano et systematiquement décortiqué? les pédo et autre détraqué séxuel utilise beaucoup se type de dissimulation !
utiliser openssl (work around!)
# Hexdump mon ami
Posté par usermind42 . Évalué à -2.
Hexdump -C | more (ou less)
quelques fichiers ont besoin de leurs moulinette pour pouvoir lire leur META INFO! (tout est dans le format…) :D
[^] # Re: Hexdump mon ami
Posté par DerekSagan . Évalué à 1.
hexdump ne retire pas les méta-données à ma connaissance, ou tu en as une version fortement modifiée
[^] # Re: Hexdump mon ami
Posté par usermind42 . Évalué à -1.
Tu as tout a fait raison, hexdump fait simplement un dump brute des données en hexadécimal,
l'option -C traduit l'hexa avec la table des caractères ASCII.
Pour pouvoir éditer les META (Quand elles sont visibles) il faut
un logiciel d'édition hexadécimal (en.wikipedia.org/wiki/Comparison_of_hex_editors)
# Que devient hachoir ?
Posté par chimrod (site web personnel) . Évalué à 4.
Il y a quelques années, on parlait du projet hachoir, destiné à lire les informations binaires dans un fichier.C'est aussi écrit en python, et commençait à gérer pas mal de fichier… Est-ce que les deux projets sont liés ? Pour ceux qui connaissent, est-ce que les deux projets pourraient s'interfacer ?Ok je viens d'aller sur le site du projet, et effectivement, c'est basé sur hachoir. Au moins voilà un projet qui ne réinvente pas la roue !
[^] # Re: Que devient hachoir ?
Posté par usermind42 . Évalué à 0.
"les matériaux et la façon" et un bon prétext pour repenser la roue :)
Suivre le flux des commentaires
Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.