Bonsoir,
j'ai testé Paperwork.
D'abord, il à fallu l'installer (sur Debian), ce n'était pas très simple, mais c'est bien documenté.
https://github.com/jflesch/paperwork/blob/stable/doc/install.debian.markdown
Il semblerait qu'il y ait une autre méthode, plus bas dans la page.
Dans les logs d'erreur, quand je voyais qu'il manquait quelque chose, je regardais d'abord s'il existait un paquet, et sinon j'essayais avec pip install.
- dateutil
- pytz
- tornado
- ???
De mémoire, j'ai aussi installé libfreetype6-dev, pour corriger l'erreur:
freetype: no [The C/C++ header for freetype2 (ft2build.h)
could not be found. You may need to install the
development package.]
Au bilan, ça fonctionne très bien.
1Go de ram, c'est trop peu, la machine s'est mise à swapper quand je lui ai fait analyser plusieurs pages.
J'aurai voulu pouvoir lui transmettre par ligne de commande des fichiers à importer, parce que par le menu je ne peu sélectionner qu'un seul fichier à la fois (c'est vite relou). Je n'ai pas trouvé de documentation concernant les lignes de commandes.
Mon prochain essai sera son installation sur une Cubietruck qui a 2Go de ram.
Bonne soirée
G
# Merci (et titre)
Posté par Jiehong (site web personnel) . Évalué à 10. Dernière modification le 17 juillet 2015 à 20:19.
Paperwork, it works!
Sinon, un peu de présentation du logiciel, ça serait pas mal.
[^] # Re: Merci (et titre)
Posté par kp . Évalué à 3.
Paperwork a souvent été présenté sur linuxfr:
https://linuxfr.org/tags/paperwork/public
En gros c'est de la numérisation (avec reconnaissance de caractères) et gestion de documents.
# moinssage
Posté par GG (site web personnel) . Évalué à 3. Dernière modification le 17 juillet 2015 à 23:02.
Curieux, je m'attendais à ce que les gens soient content d'avoir des indications concernant l'installation de Paperwork.
Alors oui, j'ai oublié de préciser à quoi sert ce logiciel.
Bon, cela a été complété dans un commentaire.
C'est la frustration du vendredi qui fait ça ?(le moinssage)
Pourquoi bloquer la publicité et les traqueurs : https://greboca.com/Pourquoi-bloquer-la-publicite-et-les-traqueurs.html
[^] # Re: moinssage
Posté par BAud (site web personnel) . Évalué à 4. Dernière modification le 17 juillet 2015 à 23:50.
Tout le monde s'en fout du moinssage dès que tu surfes à -42.
Bref, rien ne sert de focaliser dessus ou de s'en formaliser ou d'essayer le comprendre (bon, pour le moinssage des commentaires, certains pourraient essayer de comprendre).
Outre qu'un journal bénéficie de la longue traîne pour se stabiliser en note (selon les commentaires, bien souvent). Il y avait eu une étude du meilleur jour pour poster… de yoda< iirc.
Les commentaires permettent d'apporter des améliorations à sa rédaction de journaux, mais si le sujet ne prend pas, il ne veut pas prendre (j'ai tenté cmdb, togaf, itil, généralement cela a été mal accueilli :/ mais c'était sans doute aussi très mal écrit ou pas pour l'audience).
[^] # Re: moinssage
Posté par deuzene (site web personnel) . Évalué à 7.
Perso, j'ai plutôt été frustré de ne pas avoir un minimum de présentation :
/ta_vie
/ta_vie
C'est un peu brut de pomme, limite pour un forum où on se dit que ça devrait être.
Tu as l'air de penser que tout le monde sait de quoi tu parles. T'avais juste à faire ça : Paperwork, amha.
« Il vaut mieux mobiliser son intelligence sur des conneries que mobiliser sa connerie sur des choses intelligentes. »
# Quel scanner ?
Posté par jame_s . Évalué à 5.
Pour étoffer un peu ton journal, quel matériel utilises tu ? Je trouve le concept de Paperwork et de ses concurrents séduisants mais sans trouver un scanner avec chargeur de documents, voir qui fait de recto verso, et compatible Linux, pour numériser rapidement ma paperasse, l’intérêt est un peu limité.
[^] # Re: Quel scanner ?
Posté par GG (site web personnel) . Évalué à 5.
Dans tous les cas, sans chargeur, c'est pas pratique.
Cela dit, pour les tests, j'ai utilisé un scanner sans chargeur.
Je peux bien sur lui demander de scanner plusieurs pages, par lot, mais je n'ai pas fait l'essai. En principe, le scanner reviens au début et on a le temps de changer de pages avant le prochain scan.
J'ai tout un stock de scans sous forme de photos, prises avec Darktable connecté à un appareil photo numérique, et transformées ensuite avec quelques lignes de commandes.
J'ai pu demander à Paperwork d'utiliser ces documents en précisant le dossier à importer (c'est comme ça qu'on peut importer plusieurs documents).
La version actuelle de Paperwork analyse les PDF contenant des images (je n'ai pas encore essayé avec des PDF contenant du texte directement).
Quels sont les concurrents de Paperwork?
Bonne journée
G
Pourquoi bloquer la publicité et les traqueurs : https://greboca.com/Pourquoi-bloquer-la-publicite-et-les-traqueurs.html
[^] # Re: Quel scanner ?
Posté par jame_s . Évalué à 2.
Pour les concurrents, on peut citer Malodos, paprass, Mayan, medoc. Je ne les ai pas testé mais ils ont été évoqués sur linuxfr.
La solution de l'appareil photo résout le problème de la compatibilité Linux mais ce n'est vraiment pas pratique. Cela peut probablement être amélioré en mettant en place un trépied, un porte document et un éclairage dédié. Que passes tu comme script de post-traitement de tes photos ?
[^] # Re: Quel scanner ?
Posté par GG (site web personnel) . Évalué à 3.
J'ai fait un montage qui permet de supporter mon appareil photo, et avec une légère pente pour que l'orientation en mode "portrait" soit enregistrée dans les photos.
Mon script génère des photos réduites, parce que ça accélère la recherche de documents (avec Kphotoalbum ou Digikam), et ensuite je peux toujours utiliser celui à plus haute résolution pour l'impression si besoin.
Pour l'archivage du courrier, j'ai un autre script qui va augmenter le contraste et la luminosité, et générer un PDF avec l'ensemble. Ainsi, j'ai les images optimisées, et toutes les pages en 1 PDF (et un bout de script qui optimise le PDF sinon ça s'imprimme pas). Je n'ai pas les scripts sous la main, ils sont dans un ordinateur qui est actuellement sur le billard, problème matériel (mais le disque dur est en parfaite santé).
Bien sur, avec Paperwork, je dois faire un tri… sinon je me retrouve avec des traitements trop longs.
L'appareil photo est une alternative quand on a pas de chargeur de document sur le copieur (dont certains permettent de créer des PDF qu'il suffira d'envoyer à Paperwork).
Pourquoi bloquer la publicité et les traqueurs : https://greboca.com/Pourquoi-bloquer-la-publicite-et-les-traqueurs.html
[^] # Re: Quel scanner ?
Posté par GG (site web personnel) . Évalué à 3.
Bonjour,
J'ai regardé en vitesse ces quatre logiciels.
Malodos et Paperwork sont très similaires. Il me semblait que Paperwork était la suite de Malodos. Je ne sais plus.
Mayan est celui qui a le plus attiré mon attention, dont les fonctionnalités correspondent à la gestion électronique de documents.
Comparaison entre Mayan et Paperwork:
- Lorsque l'on recherche un terme parmi les documents, Paperwork va mettre en évidence les pages des documents contenant les termes, et surligner chaque occurences. Dans un document de 50 pages, c'est pratique.
- Mayan va utiliser Libreoffice pour analyser les documents doc, docx, odt, rtf… ce que Paperwork ne semble pas faire.
- Mayan fonctionne avec une interface web, et permet donc facilement de s'en servir au sein d'un intranet.
- Mayan est une grosse usine à gaz (avec les panneaux de config qui vont avec).
Bonne journée
G
Pourquoi bloquer la publicité et les traqueurs : https://greboca.com/Pourquoi-bloquer-la-publicite-et-les-traqueurs.html
[^] # Re: Quel scanner ?
Posté par feth . Évalué à 2. Dernière modification le 20 juillet 2015 à 22:03.
À cause de paperwork j'ai cherché un scanner avec chargeur, et en 24h, dans mon bled paumé (27000 âmes), j'ai obtenu avec leboncoin un HP d'occasion mais état à peu près neuf pour 45€ ; je voulais de l'ethernet, c'est de l'ethernet. Depuis, je suis convaincu que c'est très facile d'avoir un scanner avec chargeur de documents.
[^] # Re: Quel scanner ?
Posté par jame_s . Évalué à 1.
J'habite dans une grosse ville mais je n'ai rien trouvé sur leboncoin. Le site de sane liste les modèles compatibles mais n'est pas exhaustif et n'offre aucun critères de tri. Bref, ce n'est pas si simple.
# Importations de plusieurs fichiers
Posté par Jérôme Flesch (site web personnel) . Évalué à 3.
Déjà, merci pour ce retour constructif :)
Concernant les importations de plusieurs fichiers, s'il s'agit de fichiers PDF, c'est déjà possible. Il suffit de demander à importer le dossier qui les contient tous.
Pour les fichiers images, c'est malheureusement plus compliqué. Il est impossible de deviner ce qui est une page et ce qui est un document. Il faut donc que Paperwork pose la question à l'utilisateur .. sauf que, en ce moment, je manque cruellement de temps pour travailler dessus :/
[^] # Re: Importations de plusieurs fichiers
Posté par GG (site web personnel) . Évalué à 3.
Effectivement, la question est importante.
Initialement, je me posais la question pour un document PDF qui contient une image (il est analysé avec OCR), ou du texte, ou les deux. Dans ces deux derniers cas je ne sais pas ce que fait Paperwork.
Pour régler le problème de "la question", je peux fournir un script bash qui va :
- parcourir un dossier
- scruter toutes les images
- les concaténer en un fichier PDF (mais s'il y a déjà des documents PDF, ils seront inclus aussi)
- optimiser le fichier PDF pour permettre son impression
- copier ce PDF dans le dossier de travail de Paperwork
Je vais réfléchir aux paramètres, mais dans un premier temps je vais me contenter de déplacer les PDF, et éventuellement de changer la résolution des scans depuis cahque fichier PDF si possible, ou bien de reconstruire un fichier PDF comme décrit plus haut.
PS : l'installation par un générateur de paquet avec python-stdeb
https://github.com/jflesch/paperwork/blob/stable/doc/install.debian.markdown#install-through-packages-generated-by-python-stdeb
n'a pas pu aboutir parce que j'ai été bloqué avec une dépendance pour scikit-image. J'ai donc continué avec une installation selon la première méthode et c'est passé.
Pourquoi bloquer la publicité et les traqueurs : https://greboca.com/Pourquoi-bloquer-la-publicite-et-les-traqueurs.html
[^] # Re: Importations de plusieurs fichiers
Posté par Jérôme Flesch (site web personnel) . Évalué à 2.
Pour les PDFs :
Sinon, quitte à faire un script bash, autant juste placer les images comme Paperwork les attends. Si elles sont bien placées, il les prendra en compte tout seul au prochain lancement.
Pour l'installation, je sais :/ . Scikit complique tout. J'espère toujours qu'un jour quelqu'un aura le temps de faire des paquets Debian et les fera inclure dans la distribution officielle (j'en suis à mon 3ième candidat pour être mainteneur …). Ça simplifiera considérablement le problème.
Suivre le flux des commentaires
Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.