eGospodarka.pl
eGospodarka.pl poleca

eGospodarka.plGrupypl.comp.programmingDetekcja strony kodowej (Bayes?) › Re: Detekcja strony kodowej (Bayes?)
  • X-Received: by 2002:ac8:2e6a:: with SMTP id s39mr3262008qta.349.1578485994524; Wed,
    08 Jan 2020 04:19:54 -0800 (PST)
    X-Received: by 2002:ac8:2e6a:: with SMTP id s39mr3262008qta.349.1578485994524; Wed,
    08 Jan 2020 04:19:54 -0800 (PST)
    Path: news-archive.icm.edu.pl!news.icm.edu.pl!newsfeed.pionier.net.pl!3.eu.feeder.erj
    e.net!feeder.erje.net!proxad.net!feeder1-2.proxad.net!209.85.160.216.MISMATCH!g
    89no11780927qtd.0!news-out.google.com!w29ni260qtc.0!nntp.google.com!g89no117809
    16qtd.0!postnews.google.com!google-groups.googlegroups.com!not-for-mail
    Newsgroups: pl.comp.programming
    Date: Wed, 8 Jan 2020 04:19:54 -0800 (PST)
    In-Reply-To: <5e070e04$0$17363$65785112@news.neostrada.pl>
    Complaints-To: g...@g...com
    Injection-Info: google-groups.googlegroups.com; posting-host=159.205.34.176;
    posting-account=xjvq9QoAAAATMPC2X3btlHd_LkaJo_rj
    NNTP-Posting-Host: 159.205.34.176
    References: <5e060cd2$0$511$65785112@news.neostrada.pl>
    <20191227152725.50c0c2f8@mateusz>
    <5e06316a$0$17346$65785112@news.neostrada.pl>
    <20191227203426.75e401f5@mateusz>
    <5e070e04$0$17363$65785112@news.neostrada.pl>
    User-Agent: G2/1.0
    MIME-Version: 1.0
    Message-ID: <6...@g...com>
    Subject: Re: Detekcja strony kodowej (Bayes?)
    From: "M.M." <m...@g...com>
    Injection-Date: Wed, 08 Jan 2020 12:19:54 +0000
    Content-Type: text/plain; charset="UTF-8"
    Content-Transfer-Encoding: quoted-printable
    Xref: news-archive.icm.edu.pl pl.comp.programming:214672
    [ ukryj nagłówki ]

    On Saturday, December 28, 2019 at 9:15:02 AM UTC+1, Borneq wrote:
    > W dniu 2019-12-27 o 20:34, Mateusz Viste pisze:
    > > To może dałoby się załatwić oba problemy jednym podejściem? Wygenerować
    > > sobie dla każdego języka zestaw tablic częstotliwości - po jednej na
    > > każde dopuszczalne kodowanie, i sprawdzać swój plik na tej podstawie -
    > > jeśli szczęście dopisze, to mamy wykrywanie język+strona. Tylko do
    > > tego, jeśli to w ogóle ma statystyczną szansę zadziałać, trzeba mieć
    > > sporą próbkę materiału.
    > >
    > > Mateusz
    > >
    >
    > sprawdze czy zadziala

    Z częstotliwościami pomysł wydaje się dobry. Jeśli danych jest dużo, to można
    ustawić 'dziurkę od klucza' na trzy bajty, a następnie przesuwać dziurkę od
    klucza od jeden bajt. Z każdego pliku powstanie N-2 trójek, gdzie N to rozmiar
    pliku w bajtach. Jeśli danych jest mało, to dziurkę od klucza lepiej ustawić
    na 2 bajty. Tak zebrane częstotliwości można wrzucić na do sieci neuronowej.
    Zapewne częstotliwości warto będzie normalizować przed uczeniem sieci.
    Może wystarczyć najprostsza sieć z jednym liniowym neuronem, czytaj jedna
    sieć na jedno kodowanie. Takie sieci błyskawicznie się uczą przy zastosowaniu
    kwadratowej funkcji błędu.

    Pozdrawiam


Podziel się

Poleć ten post znajomemu poleć

Wydrukuj ten post drukuj


Następne wpisy z tego wątku

  • 09.01.20 09:45 M.M.

Najnowsze wątki z tej grupy


Najnowsze wątki

Szukaj w grupach

Eksperci egospodarka.pl

1 1 1

Wpisz nazwę miasta, dla którego chcesz znaleźć jednostkę ZUS.

Wzory dokumentów

Bezpłatne wzory dokumentów i formularzy.
Wyszukaj i pobierz za darmo: