j'utilise une expression régulière pour parcourir un fichier écrit en UTF-8.
Ma regexp :
Pattern.compile(".*?\\s*\\[\"(\\w+(\\s+|\\w+)*)\"\\].*?");
me permet de trouver dans mon fichier :
["gromsang"] = {
ou
[ ["fleur de feu"] = {
[mais pas
["feuillerêve"] = {
par exempleLa seule différence que je vois, ce sont les accents.
Je n'arrive pas à savoir si \w peut ou non correspondre à un caractère accentué. Si non, comment faire pour reconnaitre une expression avec des caractère accentué ou autre (ß,ü, etc.)
D'avance merci à ceux qui se pencheront sur ce problème
# PHP, non
Posté par Adrien BUSTANY (site web personnel) . Évalué à 3.
pas testé avec java, mais avec PHP j'avais eu ce problème (UTF-8 aussi). J'avais du coup créé une nouvelle classe [\w|à|é.... que j'avais stocké dans une variable (une bête chaîne de caractères en fait), et que je renvoyais dans ma regex.
[^] # Re: PHP, non
Posté par Gart Algar . Évalué à 1.
# Je manipule pas de regexs en Java, mais ...
Posté par benoar . Évalué à 3.
Suivre le flux des commentaires
Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.