-
Path: news-archive.icm.edu.pl!news.gazeta.pl!not-for-mail
From: danz <d...@g...pl>
Newsgroups: pl.comp.www
Subject: Re: Użyj wget [Było: chcę pobierać z serwisów tylko pdf]
Date: Sun, 12 Jun 2011 18:36:59 +0200
Organization: "Portal Gazeta.pl -> http://www.gazeta.pl"
Lines: 23
Message-ID: <it2pvb$mpb$1@inews.gazeta.pl>
References: <it0c6g$hv6$1@inews.gazeta.pl> <it0dn2$si7$1@news.onet.pl>
<it2n7n$eee$1@inews.gazeta.pl> <it2nrj$6p9$1@news.onet.pl>
NNTP-Posting-Host: 89-72-83-202.dynamic.chello.pl
Mime-Version: 1.0
Content-Type: text/plain; charset=UTF-8; format=flowed
Content-Transfer-Encoding: 8bit
X-Trace: inews.gazeta.pl 1307896619 23339 89.72.83.202 (12 Jun 2011 16:36:59 GMT)
X-Complaints-To: u...@a...pl
NNTP-Posting-Date: Sun, 12 Jun 2011 16:36:59 +0000 (UTC)
X-User: danz
X-Antivirus: avast! (VPS 110612-1, 2011-06-12), Outbound message
In-Reply-To: <it2nrj$6p9$1@news.onet.pl>
X-Antivirus-Status: Clean
User-Agent: Mozilla/5.0 (Windows; U; Windows NT 6.1; pl; rv:1.9.2.17) Gecko/20110414
Thunderbird/3.1.10
Xref: news-archive.icm.edu.pl pl.comp.www:399005
[ ukryj nagłówki ]W dniu 2011-06-12 18:00, Mirosław Zalewski pisze:
> niedziela, 12 czerwca 2011 17:50 wielka mądrość na czytelników pl.comp.www
> spłynęła, gdy tako rzekł(a) danz:
>
>> Ale jak w nim zaznaczyć że chodzi mi tylko o pdf?
>
> http://tnij.org/l72w
Popiołu, popiołu potrzebuję do posypania mej głowy :)
Dzięki, za pomoc :)
Jest tylko mały problem. W pierwszym adresie jest podana podpowiedź:
ps. tam jest wget -r -H -A pdf,jpg -Dfiles.site.com http://www.site.com
rozumiem że to pozwala określić by wget nie latał po wszystkich linkach
a tylko z danego serwera odsyłającej do danego serwera, podobnie widzę w
helpie "-D, --domains=LISTA lista domen oddzielonych przecinkami
akceptowanych domen."
Wpisuję więc:
wget -r -l 10 -H -A pdf -D www.pg.gda.pl http://www.pg.gda.pl
A w /home i tak olbrzymią ilość folderów z różnych domen powiązanych.
Najnowsze wątki z tej grupy
- Perfidne ataki krakerów z KRLD na skrypciarzy JS i Pajton
- Do sądu trafił pozew zbiorowy przeciw Google'owi - oskarżenie o praktyki monopolistyczne na rynku reklamy internetowej
- Jakie znacie działające serwery grup dyskusyjnych?
- is it live this group at news.icm.edu.pl
- php, linki z nazwami a $_GET, SEO
- www polityka pl captcha
- dyktatura brudnego palucha
- www.znanylekarz.pl
- Czy pytanie o sczytywanie stron programami/skryptami to tu?
- Grupy webdevowe
- Jak wydrukować stronę?
- IIS, kilka witryn
- linki <a href="/strona.php"> (ze slashami)
- co rozszerza stronę??
- responsywny akapit <p>
Najnowsze wątki
- 2025-08-06 Gdynia => Konsultant wdrożeniowy (systemy controlingowe) <=
- 2025-08-06 Białystok => Inżynier oprogramowania .Net <=
- 2025-08-06 "[...] sejmowe wystąpienie posłanki Klaudii Jachiry, która zakończyła je słowami ,,Sława Ukrainie"."
- 2025-08-05 "Chiny przekraczają w wydobyciu 4 mld ton węgla, Indie i USA ponad 1 mld, a Rosja 500 mln ton [...]"
- 2025-08-05 Panuje się 181 159,42 zł./mies. na posła w 2026r.
- 2025-08-05 "Chiny przekraczają w wydobyciu 4 mld ton węgla, Indie i USA ponad 1 mld, a Rosja 500 mln ton [...]"
- 2025-08-05 Czy cos fi przechodzi przez trafo separujące?
- 2025-08-05 kajaki i promile
- 2025-08-05 Re: Tesla jest bezpieczna, wczoraj spaliła się doszczętnie na Ursynowie i nikomu się nic nie stało
- 2025-08-05 Gdynia => Przedstawiciel handlowy / KAM (branża TSL) <=
- 2025-08-05 Re: Atak na lekarza w Oławie. Policja zatrzymała sprawcę na lotnisku Polska Agencja Prasowa 4 sierpnia 2025, 12:16 FACEBOOK X E-MAIL KOPIUJ LINK W szpitalu w Oławie 37-letni pacjent zaatakował lekarza, po tym, jak ten odmówił mu wypisania długoterminowego
- 2025-08-05 B2B i książka przychodów i rozchodów
- 2025-08-04 Re: Atak na lekarza w Oławie. Policja zatrzymała sprawcę na lotnisku Polska Agencja Prasowa 4 sierpnia 2025, 12:16 FACEBOOK X E-MAIL KOPIUJ LINK W szpitalu w Oławie 37-letni pacjent zaatakował lekarza, po tym, jak ten odmówił mu wypisania długoterminowego
- 2025-08-04 Na grupie comp.os.linux.advocacy CrudeSausage twierdzi, że Micro$lop używa SI do szyfrowania formatu dok. XML
- 2025-08-04 Na grupie comp.os.linux.advocacy CrudeSausage twierdzi, że Micro$lop używa SI do szyfrowania formatu dok. XML