Bonjour,
je cherche des outils pour développer un utilitaire qui converti des documents pdf en xml. Je cherche particulièrement des outils java (api, ou appli open source).
Il existe le programme pdftohtmlhttp://pdftohtml.sourceforge.net/
Il permet de convertir un PDF en HTML ou XML.
Et il existe en paquet précompilé dans la plupart des distributions.
Merci pour ta contrib. J'avais déjà recupéré pdftohtml, mais je voulais pouvoir développer l'appli moi même histoire de controler la conversiont et pouvoir faire des modifs au cas où!
Bah... Regarde dans les sources, ainsi que celles de ps2ascii (un script en langage postscript inclus dans ghostscript) et de pstotext (http://freshmeat.net/projects/pstotext/). Sans doute auras-tu besoin d'apprendre les bases du postscript. Bon courage !
# Scratch, scratch, scratch
Posté par mururoa69 . Évalué à 2.
Y a pas une couille dans ta question du genre pdf --> html ?
Je me trompe ?
[^] # Re: Scratch, scratch, scratch
Posté par kafarsi . Évalué à 0.
merci de participer. Non je ne me suis pas trompé je veux bien convertir des pdf en xml.
# pdftohtml
Posté par Sebastian . Évalué à 4.
Il existe le programme pdftohtml http://pdftohtml.sourceforge.net/
Il permet de convertir un PDF en HTML ou XML.
Et il existe en paquet précompilé dans la plupart des distributions.
[^] # Re: pdftohtml
Posté par kafarsi . Évalué à 1.
[^] # Re: pdftohtml
Posté par Nicolas P. . Évalué à 1.
# Merci
Posté par kafarsi . Évalué à 0.
merci pour vos réactions je vais lire tout ça pour voir si j'arrive à trouver une solution à mon problème.
Je vous tiendrai informés!
Suivre le flux des commentaires
Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.