Journal Paperwork, it works!

Posté par  (site web personnel) . Licence CC By‑SA.
Étiquettes :
18
17
juil.
2015

Bonsoir,

j'ai testé Paperwork.

D'abord, il à fallu l'installer (sur Debian), ce n'était pas très simple, mais c'est bien documenté.
https://github.com/jflesch/paperwork/blob/stable/doc/install.debian.markdown

Il semblerait qu'il y ait une autre méthode, plus bas dans la page.

Dans les logs d'erreur, quand je voyais qu'il manquait quelque chose, je regardais d'abord s'il existait un paquet, et sinon j'essayais avec pip install.

  • dateutil
  • pytz
  • tornado
  • ???

De mémoire, j'ai aussi installé libfreetype6-dev, pour corriger l'erreur:

    freetype: no  [The C/C++ header for freetype2 (ft2build.h)
                                could not be found.  You may need to install the
                                development package.]

Au bilan, ça fonctionne très bien.

1Go de ram, c'est trop peu, la machine s'est mise à swapper quand je lui ai fait analyser plusieurs pages.

J'aurai voulu pouvoir lui transmettre par ligne de commande des fichiers à importer, parce que par le menu je ne peu sélectionner qu'un seul fichier à la fois (c'est vite relou). Je n'ai pas trouvé de documentation concernant les lignes de commandes.

Mon prochain essai sera son installation sur une Cubietruck qui a 2Go de ram.

Bonne soirée
G

  • # Merci (et titre)

    Posté par  (site web personnel) . Évalué à 10. Dernière modification le 17 juillet 2015 à 20:19.

    Paperwork, it's works!

    Paperwork, it works!

    Sinon, un peu de présentation du logiciel, ça serait pas mal.

  • # moinssage

    Posté par  (site web personnel) . Évalué à 3. Dernière modification le 17 juillet 2015 à 23:02.

    Curieux, je m'attendais à ce que les gens soient content d'avoir des indications concernant l'installation de Paperwork.

    Alors oui, j'ai oublié de préciser à quoi sert ce logiciel.
    Bon, cela a été complété dans un commentaire.

    C'est la frustration du vendredi qui fait ça ?(le moinssage)

    Pourquoi bloquer la publicité et les traqueurs : https://greboca.com/Pourquoi-bloquer-la-publicite-et-les-traqueurs.html

    • [^] # Re: moinssage

      Posté par  (site web personnel) . Évalué à 4. Dernière modification le 17 juillet 2015 à 23:50.

      C'est la frustration du vendredi qui fait ça ?(le moinssage)

      Tout le monde s'en fout du moinssage dès que tu surfes à -42.

      Bref, rien ne sert de focaliser dessus ou de s'en formaliser ou d'essayer le comprendre (bon, pour le moinssage des commentaires, certains pourraient essayer de comprendre).
      Outre qu'un journal bénéficie de la longue traîne pour se stabiliser en note (selon les commentaires, bien souvent). Il y avait eu une étude du meilleur jour pour poster… de yoda< iirc.

      Les commentaires permettent d'apporter des améliorations à sa rédaction de journaux, mais si le sujet ne prend pas, il ne veut pas prendre (j'ai tenté cmdb, togaf, itil, généralement cela a été mal accueilli :/ mais c'était sans doute aussi très mal écrit ou pas pour l'audience).

    • [^] # Re: moinssage

      Posté par  (site web personnel) . Évalué à 7.

      Curieux, je m'attendais à ce que les gens soient content d'avoir des indications concernant l'installation de Paperwork.

      Perso, j'ai plutôt été frustré de ne pas avoir un minimum de présentation :

      /ta_vie

      Bonsoir,

      j'ai testé Paperwork.

      /ta_vie

      C'est un peu brut de pomme, limite pour un forum où on se dit que ça devrait être.
      Tu as l'air de penser que tout le monde sait de quoi tu parles. T'avais juste à faire ça : Paperwork, amha.

      « Il vaut mieux mobiliser son intelligence sur des conneries que mobiliser sa connerie sur des choses intelligentes. »

  • # Quel scanner ?

    Posté par  . Évalué à 5.

    Pour étoffer un peu ton journal, quel matériel utilises tu ? Je trouve le concept de Paperwork et de ses concurrents séduisants mais sans trouver un scanner avec chargeur de documents, voir qui fait de recto verso, et compatible Linux, pour numériser rapidement ma paperasse, l’intérêt est un peu limité.

    • [^] # Re: Quel scanner ?

      Posté par  (site web personnel) . Évalué à 5.

      Dans tous les cas, sans chargeur, c'est pas pratique.

      Cela dit, pour les tests, j'ai utilisé un scanner sans chargeur.
      Je peux bien sur lui demander de scanner plusieurs pages, par lot, mais je n'ai pas fait l'essai. En principe, le scanner reviens au début et on a le temps de changer de pages avant le prochain scan.

      J'ai tout un stock de scans sous forme de photos, prises avec Darktable connecté à un appareil photo numérique, et transformées ensuite avec quelques lignes de commandes.
      J'ai pu demander à Paperwork d'utiliser ces documents en précisant le dossier à importer (c'est comme ça qu'on peut importer plusieurs documents).

      La version actuelle de Paperwork analyse les PDF contenant des images (je n'ai pas encore essayé avec des PDF contenant du texte directement).

      Quels sont les concurrents de Paperwork?

      Bonne journée
      G

      Pourquoi bloquer la publicité et les traqueurs : https://greboca.com/Pourquoi-bloquer-la-publicite-et-les-traqueurs.html

      • [^] # Re: Quel scanner ?

        Posté par  . Évalué à 2.

        Pour les concurrents, on peut citer Malodos, paprass, Mayan, medoc. Je ne les ai pas testé mais ils ont été évoqués sur linuxfr.

        La solution de l'appareil photo résout le problème de la compatibilité Linux mais ce n'est vraiment pas pratique. Cela peut probablement être amélioré en mettant en place un trépied, un porte document et un éclairage dédié. Que passes tu comme script de post-traitement de tes photos ?

        • [^] # Re: Quel scanner ?

          Posté par  (site web personnel) . Évalué à 3.

          J'ai fait un montage qui permet de supporter mon appareil photo, et avec une légère pente pour que l'orientation en mode "portrait" soit enregistrée dans les photos.

          Mon script génère des photos réduites, parce que ça accélère la recherche de documents (avec Kphotoalbum ou Digikam), et ensuite je peux toujours utiliser celui à plus haute résolution pour l'impression si besoin.

          Pour l'archivage du courrier, j'ai un autre script qui va augmenter le contraste et la luminosité, et générer un PDF avec l'ensemble. Ainsi, j'ai les images optimisées, et toutes les pages en 1 PDF (et un bout de script qui optimise le PDF sinon ça s'imprimme pas). Je n'ai pas les scripts sous la main, ils sont dans un ordinateur qui est actuellement sur le billard, problème matériel (mais le disque dur est en parfaite santé).

          Bien sur, avec Paperwork, je dois faire un tri… sinon je me retrouve avec des traitements trop longs.

          L'appareil photo est une alternative quand on a pas de chargeur de document sur le copieur (dont certains permettent de créer des PDF qu'il suffira d'envoyer à Paperwork).

          Pourquoi bloquer la publicité et les traqueurs : https://greboca.com/Pourquoi-bloquer-la-publicite-et-les-traqueurs.html

        • [^] # Re: Quel scanner ?

          Posté par  (site web personnel) . Évalué à 3.

          Pour les concurrents, on peut citer Malodos, paprass, Mayan, medoc. Je ne les ai pas testé mais ils ont été évoqués sur linuxfr.

          Bonjour,

          J'ai regardé en vitesse ces quatre logiciels.
          Malodos et Paperwork sont très similaires. Il me semblait que Paperwork était la suite de Malodos. Je ne sais plus.

          Mayan est celui qui a le plus attiré mon attention, dont les fonctionnalités correspondent à la gestion électronique de documents.

          Comparaison entre Mayan et Paperwork:
          - Lorsque l'on recherche un terme parmi les documents, Paperwork va mettre en évidence les pages des documents contenant les termes, et surligner chaque occurences. Dans un document de 50 pages, c'est pratique.
          - Mayan va utiliser Libreoffice pour analyser les documents doc, docx, odt, rtf… ce que Paperwork ne semble pas faire.
          - Mayan fonctionne avec une interface web, et permet donc facilement de s'en servir au sein d'un intranet.
          - Mayan est une grosse usine à gaz (avec les panneaux de config qui vont avec).

          Bonne journée
          G

          Pourquoi bloquer la publicité et les traqueurs : https://greboca.com/Pourquoi-bloquer-la-publicite-et-les-traqueurs.html

    • [^] # Re: Quel scanner ?

      Posté par  . Évalué à 2. Dernière modification le 20 juillet 2015 à 22:03.

      À cause de paperwork j'ai cherché un scanner avec chargeur, et en 24h, dans mon bled paumé (27000 âmes), j'ai obtenu avec leboncoin un HP d'occasion mais état à peu près neuf pour 45€ ; je voulais de l'ethernet, c'est de l'ethernet. Depuis, je suis convaincu que c'est très facile d'avoir un scanner avec chargeur de documents.

      • [^] # Re: Quel scanner ?

        Posté par  . Évalué à 1.

        J'habite dans une grosse ville mais je n'ai rien trouvé sur leboncoin. Le site de sane liste les modèles compatibles mais n'est pas exhaustif et n'offre aucun critères de tri. Bref, ce n'est pas si simple.

  • # Importations de plusieurs fichiers

    Posté par  (site web personnel) . Évalué à 3.

    Déjà, merci pour ce retour constructif :)

    Concernant les importations de plusieurs fichiers, s'il s'agit de fichiers PDF, c'est déjà possible. Il suffit de demander à importer le dossier qui les contient tous.

    Pour les fichiers images, c'est malheureusement plus compliqué. Il est impossible de deviner ce qui est une page et ce qui est un document. Il faut donc que Paperwork pose la question à l'utilisateur .. sauf que, en ce moment, je manque cruellement de temps pour travailler dessus :/

    • [^] # Re: Importations de plusieurs fichiers

      Posté par  (site web personnel) . Évalué à 3.

      Effectivement, la question est importante.

      Initialement, je me posais la question pour un document PDF qui contient une image (il est analysé avec OCR), ou du texte, ou les deux. Dans ces deux derniers cas je ne sais pas ce que fait Paperwork.

      Pour régler le problème de "la question", je peux fournir un script bash qui va :
      - parcourir un dossier
      - scruter toutes les images
      - les concaténer en un fichier PDF (mais s'il y a déjà des documents PDF, ils seront inclus aussi)
      - optimiser le fichier PDF pour permettre son impression
      - copier ce PDF dans le dossier de travail de Paperwork

      Je vais réfléchir aux paramètres, mais dans un premier temps je vais me contenter de déplacer les PDF, et éventuellement de changer la résolution des scans depuis cahque fichier PDF si possible, ou bien de reconstruire un fichier PDF comme décrit plus haut.

      PS : l'installation par un générateur de paquet avec python-stdeb
      https://github.com/jflesch/paperwork/blob/stable/doc/install.debian.markdown#install-through-packages-generated-by-python-stdeb
      n'a pas pu aboutir parce que j'ai été bloqué avec une dépendance pour scikit-image. J'ai donc continué avec une installation selon la première méthode et c'est passé.

      Pourquoi bloquer la publicité et les traqueurs : https://greboca.com/Pourquoi-bloquer-la-publicite-et-les-traqueurs.html

      • [^] # Re: Importations de plusieurs fichiers

        Posté par  (site web personnel) . Évalué à 2.

        Pour les PDFs :

        • Si un PDF contient du texte, à l'import, c'est ce texte qui est utilisé
        • Si aucun texte n'est trouvé dedans, à l'import, Paperwork passe l'OCR dessus
        • Il est possible de forcer Paperwork à passer l'OCR dessus (cf options avancées). Ça s'est révélé utile pour moi : J'avais le PDF d'une facture qui était en fait une image, avec, sous l'image, un texte bidon mais placé au même endroit que le texte de l'image. Je suppose qu'il s'agissait d'empêcher les copier-coller.

        Sinon, quitte à faire un script bash, autant juste placer les images comme Paperwork les attends. Si elles sont bien placées, il les prendra en compte tout seul au prochain lancement.

        Pour l'installation, je sais :/ . Scikit complique tout. J'espère toujours qu'un jour quelqu'un aura le temps de faire des paquets Debian et les fera inclure dans la distribution officielle (j'en suis à mon 3ième candidat pour être mainteneur …). Ça simplifiera considérablement le problème.

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.