eGospodarka.pl
eGospodarka.pl poleca

eGospodarka.plGrupypl.comp.wwwCzy pytanie o sczytywanie stron programami/skryptami to tu? › Re: Sczytywanie skryptem Amazon Top100 [wget (User-Agent) rulez? Nie.]
  • Path: news-archive.icm.edu.pl!news.icm.edu.pl!newsfeed.pionier.net.pl!2.eu.feeder.erj
    e.net!feeder.erje.net!eternal-september.org!reader02.eternal-september.org!.POS
    TED!not-for-mail
    From: "Andrzej A. Filip" <a...@o...eu>
    Newsgroups: pl.comp.www
    Subject: Re: Sczytywanie skryptem Amazon Top100 [wget (User-Agent) rulez? Nie.]
    Date: Fri, 11 Mar 2022 07:31:14 +0100 (CET)
    Organization: It is for me to know and for you to find out.
    Lines: 29
    Message-ID: <a...@w...eu>
    References: <a...@w...eu> <622875ce$0$500$65785112@news.neostrada.pl>
    <a...@w...eu> <6229ab7a$0$488$65785112@news.neostrada.pl>
    <a...@w...eu>
    Mime-Version: 1.0
    Content-Type: text/plain; charset=utf-8
    Content-Transfer-Encoding: 8bit
    Injection-Info: reader02.eternal-september.org;
    posting-host="bf97d023af2c160e715194203fcb9af3";
    logging-data="29744";
    mail-complaints-to="a...@e...org";
    posting-account="U2FsdGVkX18C9vEtQUwBbONCpD9lgYum"
    Cancel-Lock: sha1:AdnNkMo0mypvOVXKtHRudgKvinU= sha1:ODp4MsuI1h5w0KLapZHPFgNovVk=
    Xref: news-archive.icm.edu.pl pl.comp.www:403707
    [ ukryj nagłówki ]

    "Andrzej A. Filip" <a...@o...eu> pisze:
    > Tomek <s...@w...xx.pl> pisze:
    >> W dniu 09.03.2022 o 14:41, Andrzej A. Filip pisze:
    >>> Czy da się *bez java-script* sczytać pełne top100 z list amazona?
    >>> Może skryptu bez java-script (po stronie klienta) widzą pozycje
    >>> 1:30 i 51:80.
    >>> https://www.amazon.com/best-sellers-books-Amazon/zgb
    s/books/
    >>>
    >>
    >> A sprawdzałeś jak sobie radzi "wget"?
    >
    > Chciałem sprawdzić tylko "na odczepnego" ale o dziwo różnica jest i na
    > pierwszy rzut oka jest 50 pozycji na stronie. Dzięki za *o dziwo*
    > działające rozwiązane. Później sprawdzę czy samo ustawienie nagłówka
    > User-Agent wystarcza [raczej tak nie niekoniecznie (na dłużej)].
    >
    > Wkopałem się w obecną pozycję bo AFAIR Amazon się biesił na pusty
    > User-Agent albo "nie poprawiony" dla WWW::Mechanize (perl).
    > Zresztą AFAIR Amazon co kilka miesięcy odstawia "małą rewolucje".

    Sugestia przestała był użyteczna. Amazon blokuje User-Agent wget i
    samego wget "zależnie od fazy księżyca". Kilka razy zadziałało a
    teraz blokuje dostęp prawie zawsze.

    PO prostu użyje czego innego to śledzenia nowości z kategorii książek
    które mnie interesują "w akceptowalnym dla mnie formacie".

    --
    Andrzej A. Filip

Podziel się

Poleć ten post znajomemu poleć

Wydrukuj ten post drukuj


Następne wpisy z tego wątku

Najnowsze wątki z tej grupy


Najnowsze wątki

Szukaj w grupach

Eksperci egospodarka.pl

1 1 1

Wpisz nazwę miasta, dla którego chcesz znaleźć jednostkę ZUS.

Wzory dokumentów

Bezpłatne wzory dokumentów i formularzy.
Wyszukaj i pobierz za darmo: