eGospodarka.pl
eGospodarka.pl poleca

eGospodarka.plGrupypl.comp.programmingkompresja danych › Re: kompresja danych
  • Path: news-archive.icm.edu.pl!news.gazeta.pl!newsfeed.pionier.net.pl!news.glorb.com!p
    ostnews.google.com!d10g2000yqh.googlegroups.com!not-for-mail
    From: Mariusz Marszałkowski <m...@g...com>
    Newsgroups: pl.comp.programming
    Subject: Re: kompresja danych
    Date: Sun, 18 Oct 2009 00:37:55 -0700 (PDT)
    Organization: http://groups.google.com
    Lines: 27
    Message-ID: <3...@d...googlegroups.com>
    References: <4...@c...googlegroups.com>
    <2...@p...null.onet.pl.invalid>
    <8...@s...googlegroups.com>
    <2...@p...null.onet.pl.invalid>
    <4...@l...googlegroups.com>
    <2...@p...null.onet.pl.invalid>
    NNTP-Posting-Host: 89.229.16.190
    Mime-Version: 1.0
    Content-Type: text/plain; charset=ISO-8859-2
    Content-Transfer-Encoding: quoted-printable
    X-Trace: posting.google.com 1255851476 22126 127.0.0.1 (18 Oct 2009 07:37:56 GMT)
    X-Complaints-To: g...@g...com
    NNTP-Posting-Date: Sun, 18 Oct 2009 07:37:56 +0000 (UTC)
    Complaints-To: g...@g...com
    Injection-Info: d10g2000yqh.googlegroups.com; posting-host=89.229.16.190;
    posting-account=xjvq9QoAAAATMPC2X3btlHd_LkaJo_rj
    User-Agent: G2/1.0
    X-HTTP-UserAgent: Mozilla/5.0 (Windows; U; Windows NT 5.2; pl; rv:1.9.1.3)
    Gecko/20090824 Firefox/3.5.3,gzip(gfe),gzip(gfe)
    Xref: news-archive.icm.edu.pl pl.comp.programming:183835
    [ ukryj nagłówki ]

    On 18 Paź, 02:55, Wojciech Muła
    <w...@p...null.onet.pl.invalid> wrote:
    > Mariusz Marszałkowski <m...@g...com> wrote:
    > > Pewnie najlepiej wypadnie najpierw długość serii + zamiana
    > > wartości na pozycję + jakaś metda LZ. Długość serii dekompresuje
    > > się błyskawicznie, zamiana wartości na pozycję trochę gorzej,
    > > LZ też jest bardzo szybkie.
    >
    > > Więc pozostaje pytanie jaką metodą zmienić kolejność rekordów,
    > > aby jakoś kompresji była jak najlepsza.
    >
    > Przeanalizowałem pierwszy milion rekordów i moje wnioski
    > są następujące. Po odrzuceniu niektórych kolumn, liczba
    > różnych kombinacji wartości w rekordach jest stosunkowo mała.
    > Odrzuciłem kolumny 0, 21, 22 i 23 - liczba kombinacji
    > to mniej niż 100 tysięcy. Pewnie jakby odrzucić trochę więcej,
    > ta liczba spadłaby (jest już późno, nie chce mi się bawić).
    >
    > Więc można wpierw pogrupować rekordy wg tych kombinacji, np.
    > wrzucić do hashmapy; od razu znasz wartości 20-kilku kolumn.
    > Zaś pozostałe kolumny można już kompresować, albo nawet zapisać
    > wprost, pewnie byś się zmieścił w kilku bajtach na rekord.

    Dziękuję serdecznie.

Podziel się

Poleć ten post znajomemu poleć

Wydrukuj ten post drukuj


Następne wpisy z tego wątku

Najnowsze wątki z tej grupy


Najnowsze wątki

Szukaj w grupach

Eksperci egospodarka.pl

1 1 1

Wpisz nazwę miasta, dla którego chcesz znaleźć jednostkę ZUS.

Wzory dokumentów

Bezpłatne wzory dokumentów i formularzy.
Wyszukaj i pobierz za darmo: