Bonjour,
j'ai certains fichier sources en utf8 et d'autre en us-ascii.
qd je fais un file -i temp.tmp
temp.tmp : text/plain charset)us-ascii.
J'essaye de l'enregistrer en gedit, il me dit que c'est en UTF8 mais le file me dit tjr que c'est de l'ascii.
Et justement ce fichier me fait planter mon application à cause des accents dedans...
Any idea??
J'ai essayé
iconv -f ASCII -t UTF-8 temp.tmp > temp2.tmp && file -i temp2.tmp
temp2.tmp : text/plain charset=us-ascii
...GRR
Merci
# Est-ce vraiment de l'us-ascii ?
Posté par Bernez . Évalué à 7.
Cependant tu parles de caractères accentués. Or il n'y a pas de caractères accentués dans us-ascii. Y a-t-il vraiment des caractères accentués dans ton fichier ? Si oui, avec un éditeur hexadécimal (par exemple hexedit) regarde sur combien d'octets ils sont codés. Si ils sont sur un octet, alors c'est probablement du latin1 et la conversion sera à faire de latin1 vers utf8.
# Ok
Posté par xabi . Évalué à 1.
Merci
[^] # Re: Ok
Posté par Obsidian . Évalué à 3.
Ce que t'expliquais Bernard ci-dessus, c'est que tant que tu ne mets pas de caractère spécial dans ton fichier, il n'y a aucun moyen de savoir a priori si c'est de l'ASCII strict ou si c'est de l'UTF-8 dont on n'aurait pas utilisé les extensions.
Il faut bien comprendre que le jeu de caractères utilisé n'est pas spécifié dans un fichier texte, qui ne contient que des caractères. Exemple bête : si je fais un fichier de 1 seul octet contenant en tout et pour tout la lettre « A ». Quel jeu de caractères considères-tu avoir utilisé ? UTF-8 ? ISO-8859-15 ? ASCII standard ?
# Ok
Posté par xabi . Évalué à 0.
Merci
Suivre le flux des commentaires
Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.