Dans les évolutions de Awk, celle-là me parait une avancée importante. Les fichiers CSV sont utilisés dans plein de domaines, et pouvoir les traiter directement avec un langage comme Awk est quelque chose que les gens attendent depuis longtemps.
C’est super le format CSV, c’est simple facile, à construire, facile à lire, sauf que
Le format CSV n’est pas un format texte mais un format binaire.
Le format CSV n’est pas un format texte mais un format binaire.
Le format CSV n’est pas un format texte mais un format binaire.
mais quand on s’en rend compte, c’est trop tard. On est piégé. Fini. Foutu.
Ça fonctionne bien tant qu’on travaille sur ses propres fichiers de son coté, mais dès qu’on s’ouvre au monde on découvre à quel point l’univers est cruel :
Niveau 0 :
les européens qui utilisent le point virgule à la place de la virgule
les caractères d’échappements avant les séparateurs de champs (\,)
les caractères d’échappements qui sont échappé eux meme (\\,)
Niveau 1 :
les séparateurs de champ qui sont contenus dans un bloc texte (",")
les caractères de bloc textes qui n’en sont pas vraiment car précédé par un caractère d’échappement (\")
Niveau 2 :
toutes les combinaisons possibles des niveau 0 et 1
le texte contenant des retours chariots
les formules excels stockées directement le CSV (="Du texte")
Et la découverte de cette année : Excel enregistre le "CSV au format UTF-8" en ajoutant un Indicateur d'ordre des octets — ou BOM pour les intimes. Il te faut donc commencer à lire les premiers octets du fichier voir s’il s’agit d’un BOM, et si c’est le cas ne commencer à parser le fichier qu’après. (un exemple de cas posant problème dans un ticket de bug ouvert que j’ai ouvert suite à ça)
Allez on le répète une dernière fois pour la route
Le format CSV n’est pas un format texte mais un format binaire.
Nos traitements : un pouillème de secondes (avec en entrée du CSV). Derrière l’équipe qui poursuit (avec du xml je crois, sur un volume partiel) voit les machines partir en carafe…
# CSV
Posté par Tonton Th (Mastodon) . Évalué à 6.
Dans les évolutions de Awk, celle-là me parait une avancée importante. Les fichiers CSV sont utilisés dans plein de domaines, et pouvoir les traiter directement avec un langage comme Awk est quelque chose que les gens attendent depuis longtemps.
https://benhoyt.com/writings/goawk-csv/
[^] # Re: CSV
Posté par chimrod (site web personnel) . Évalué à 4.
C’est super le format CSV, c’est simple facile, à construire, facile à lire, sauf que
mais quand on s’en rend compte, c’est trop tard. On est piégé. Fini. Foutu.
Ça fonctionne bien tant qu’on travaille sur ses propres fichiers de son coté, mais dès qu’on s’ouvre au monde on découvre à quel point l’univers est cruel :
Niveau 0 :
\,
)\\,
)Niveau 1 :
\"
)Niveau 2 :
="Du texte"
)Et la découverte de cette année : Excel enregistre le "CSV au format UTF-8" en ajoutant un Indicateur d'ordre des octets — ou BOM pour les intimes. Il te faut donc commencer à lire les premiers octets du fichier voir s’il s’agit d’un BOM, et si c’est le cas ne commencer à parser le fichier qu’après. (un exemple de cas posant problème dans un ticket de bug ouvert que j’ai ouvert suite à ça)
Allez on le répète une dernière fois pour la route
Pfff ça va mieux.
[^] # Re: CSV
Posté par purplepsycho . Évalué à 4.
Alors comme ça tu veux faire du CSV ?
[^] # Re: CSV
Posté par PR . Évalué à 3.
Le cas m’est encore! arrivé y’a deux semaines.
Nos traitements : un pouillème de secondes (avec en entrée du CSV). Derrière l’équipe qui poursuit (avec du xml je crois, sur un volume partiel) voit les machines partir en carafe…
Ça en devient un running gag :-°
Mort aux cons !
[^] # Re: CSV
Posté par Gil Cot ✔ (site web personnel, Mastodon) . Évalué à 2.
Comme dirait damaki, c'est un meta-standard, qui comme dirait gilcot, n'est respecté par personne pour couronner le tout. Une plaie qui ne dit pas son nom…
“It is seldom that liberty of any kind is lost all at once.” ― David Hume
[^] # Re: CSV
Posté par Gil Cot ✔ (site web personnel, Mastodon) . Évalué à 2.
On va pouvoir remiser fawk, xsv, csvkit, csvtool, tsv-utils, etc. et autres csvspoon et miller ? Tant d'énergie investie dans ce faux format m'épate.
“It is seldom that liberty of any kind is lost all at once.” ― David Hume
Suivre le flux des commentaires
Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.