Baixar todos os arquivos de um site com o Wget


Expressão regular com o Wget.

Eu acesso muitos sites de faculdades onde professores deixam arquivos para as aulas de seus alunos, gosto muito destes arquivos principalmente da didática destes.

Segue baixo.

wget -r -l 1 -A pdf http://www.site-examplo.com/documentos

Onde:

  • -r Recursivo.
  • -l 1 Um nível apenas.
  • -A Tipo do arquivo.
Anúncios

, ,

  1. #1 por Tiago Peczenyj em 3 de novembro de 2010 - 5:49 am

    ola

    vc nao esta usando expressoes regulares e sim baixando todos os arquivos de forma recursiva indicando a quantidade de diretorios que vc vai percorrer.

    o que vc pode fazer é usar globbing em urls de FTP, estilo *.txt

    o curl possui uma sintaxe para trabalhar com multiplas urls fazendo uso de {um,dois} como de ranges [1-100]

    nada disso pode ser considerado expressao regular, que faz uso de grupos, quantificadores, ancoras, bordas, classes, etc.

    se o wget suportasse isso

    wget –opcoes http://www.google.com/%5Baeiou%5D\d{2,4}(beta)?.(txt|js)$

    ai sim seria o uso de expressoes regulares.

  2. #2 por me em 1 de dezembro de 2010 - 3:36 am

    makes me want to drink alchoholic beverages

Deixe um comentário

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logotipo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair / Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair / Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair / Alterar )

Foto do Google+

Você está comentando utilizando sua conta Google+. Sair / Alterar )

Conectando a %s

  • Follow Carl Roberson's on WordPress.com
  • Fallow me
  • Linux 20 Anos
  • Ubuntu LTS Trusty Tahr

    Lançamento da versão LTS do Ubuntu20 de abril de 2014
    Ubuntu LTS Trusty Tahr Chegou!!! http://www.ubuntu.com/download/desktop
  • Grafica Livre

  • O que estou lendo agora

  • Na minha estante me aguardando


    Literatura
  • Bookmark and Share
%d blogueiros gostam disto: