Forum général.général quelques precisions sur wget

Posté par  .
Étiquettes : aucune
0
15
juil.
2004
bonjour,

je ne sais pas trop ou poster, j'espère que c'est le bon endroit ...

Comment fais t'on pour télécharger uniquement des jpeg de plus de 25Ko ?



"wget -rkpE -np http://www.u-blog.net/stephane/(...)
-np : no-parent : reste à l?intérieur du répertoire donné et n?en déborde pas"
http://www.metacites.net/article28.html(...)

je ne comprends pas trop l'interet de -np. Si l'on télécharge à partir d'un répertoire sur un site avec l'option -r (wget -r http://www.u-blog.net/stephane/(...) ) normallement, selon moi on téléchargement que tout les fichiers et sous repertoires dans /stephane.
Non ????

je ne comprends pas trop l'interet de cette option -np (no-parent)
  • # Sauf erreurs

    Posté par  . Évalué à 2.

    pour télécharger les images (à supposer qu'elles portent toutes l'extention .jpg) :
    wget -r -nd -np -A "*.jpg"

    -r : récursif
    -nd : pas de répertoire (si les images sont dans pleins de sous dossier, cela va tous les mettres dans le même)
    -np : no-parent (la question que tu poses) empèche de déborder, ce qui veut dire que si dans une des pages parcourus, tu à un liens remontant par exemple au niveau précédent, il ne va pas le suivre ce qui aurait pour conséquent de télécharger tout les fichiers des branches "parallèles" dans l'architecture du site.
    -A "*.jpg" : accépter les fichiers de la forme *.jpg et uniquement cela. (la fonction opposé est -R et peut être cumulé (genre -A "*.jpg" -R "*small*" suivant quand sont nommé les miniatures que tu souhaites apprament éliminer de ton téléchargement).
    • [^] # Re: Sauf erreurs

      Posté par  . Évalué à 1.

      merci seginus pour ta reponse
      je l'ai lu hier et ca m'a bien servi

      j'ai encore une toute petite question :

      lorsque je vais rechercher par exemple un fichier qui n'existe pas
      toto=`wget -O- "http://fuma.free.fr/config_win.(...)" | grep -i path`


      ca m'affiche ca :

      --13:33:53-- http://fuma.free.fr/config_win.(...)
      => `-'
      Résolution de fuma.free.fr... 212.27.40.183
      Connexion vers fuma.free.fr[212.27.40.183]:80...connecté.
      requête HTTP transmise, en attente de la réponse...404 Not Found
      13:33:53 ERREUR 404: Not Found

      c'est pas tres beau. Est ce que c'est une erreur et donc est ce que la sortie d'erreur peut etre redirigé vers /dev/null. Logiquement ca devrait donné ca 2 > /dev/null mais je n'y arrive ...


      Si ce n'est pas possible, ce n'est pas bien grave. Lorsque le fichier demandé n'existe pas, toto = "", toto est vide
      • [^] # Re: Sauf erreurs

        Posté par  . Évalué à 2.

        Il ne faut pas mettre d'espace en entre le 2 et le >
        wget fichier 2>/dev/null fonctionne.
        Sinon, pour tout rediriger (erreurs et autres) wget fichier &>/dev/null
        • [^] # Re: Sauf erreurs

          Posté par  . Évalué à 1.

          a titre d'info, ca peut etre utile comme fais tu pour avoir
          - l'affichage du resultat de la commande
          et
          - rediriger enregistrer le resultat de la commande en faisant une redirection ...


          par exemple quand je fais un wget, cela
          - m'affiche la barre d'avancement du dowload à l'ecran pour controler en direct le download,
          et que cette barre d'avancement et tout le reste soit en enregistrer dans un fichier

          quand je fais un
          wget http://titi.com(...) 1>dl.log, par exemple, je n'ai plus d'affichage...

          et encore merci a toi
          • [^] # Re: Sauf erreurs

            Posté par  . Évalué à 2.

            La commande tee sert à ça. Mais je n'ai jamais eu l'occasion de m'en servir, donc, je ne peux pas t'aider plus la-dessus.

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.