Forum Linux.général wget

Posté par  .
Étiquettes : aucune
0
25
oct.
2004
avec wget, je ne voudrais télécharger queles fichiers *.pdf d'un site http://monsite.fr(...) tel que la taille du pdf soit supérieur ou égal à 100 Ko.
J'ai potassé la doc de wget mais j'ai pas trouvé mention de cela. QQn a une idée ? merci !
  • # Restriction sur les types de fichier

    Posté par  . Évalué à 3.

    Tu peux ne télécharger que des pdf en utilisant l'option -A (accept) : wget -A pdf site

    http://www.gnu.org/software/wget/manual/wget-1.8.1/html_node/wget_1(...)

    Pour la limitation en taille, je ne sais pas si c'est possible.
  • # petit script

    Posté par  . Évalué à 1.

    Tu écris un script qui prend la liste de tous les fichiers à télécharger, regarde l'extension du fichier (ou toute autre règle simple à implémenter et qui sert à déterminer le type d'un fichier), qui filtre la taille.

    Tu passes ensuite tous ces noms de fichiers à wget pour qu'il les télécharge.

    Je ne peux pas t'écrire le script car je ne sais pas à quoi ressemble la page de ton site: est-ce un listing de fichiers du type Apache, ou est-ce que les noms des fichiers sont inclus dans une page html ?

    Si tu ne peux pas obtenir la taille, bin je crains que ça ne soit fichu pour toi. Tu peux toujours écrire un patch pour wget, mais je ne sais pas si tu en le temps, ou les moyens :)

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.