avec wget, je ne voudrais télécharger queles fichiers *.pdf d'un site http://monsite.fr(...) tel que la taille du pdf soit supérieur ou égal à 100 Ko.
J'ai potassé la doc de wget mais j'ai pas trouvé mention de cela. QQn a une idée ? merci !
Tu écris un script qui prend la liste de tous les fichiers à télécharger, regarde l'extension du fichier (ou toute autre règle simple à implémenter et qui sert à déterminer le type d'un fichier), qui filtre la taille.
Tu passes ensuite tous ces noms de fichiers à wget pour qu'il les télécharge.
Je ne peux pas t'écrire le script car je ne sais pas à quoi ressemble la page de ton site: est-ce un listing de fichiers du type Apache, ou est-ce que les noms des fichiers sont inclus dans une page html ?
Si tu ne peux pas obtenir la taille, bin je crains que ça ne soit fichu pour toi. Tu peux toujours écrire un patch pour wget, mais je ne sais pas si tu en le temps, ou les moyens :)
# Restriction sur les types de fichier
Posté par durandal . Évalué à 3.
http://www.gnu.org/software/wget/manual/wget-1.8.1/html_node/wget_1(...)
Pour la limitation en taille, je ne sais pas si c'est possible.
# petit script
Posté par kd . Évalué à 1.
Tu passes ensuite tous ces noms de fichiers à wget pour qu'il les télécharge.
Je ne peux pas t'écrire le script car je ne sais pas à quoi ressemble la page de ton site: est-ce un listing de fichiers du type Apache, ou est-ce que les noms des fichiers sont inclus dans une page html ?
Si tu ne peux pas obtenir la taille, bin je crains que ça ne soit fichu pour toi. Tu peux toujours écrire un patch pour wget, mais je ne sais pas si tu en le temps, ou les moyens :)
Suivre le flux des commentaires
Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.