eGospodarka.pl
eGospodarka.pl poleca

eGospodarka.plGrupypl.comp.programmingkompresja danych › Re: kompresja danych
  • Path: news-archive.icm.edu.pl!news.gazeta.pl!newsfeed.pionier.net.pl!news.nask.pl!new
    s.nask.org.pl!news.onet.pl!not-for-mail
    From: Wojciech Muła <w...@p...null.onet.pl.invalid>
    Newsgroups: pl.comp.programming
    Subject: Re: kompresja danych
    Date: Sun, 18 Oct 2009 02:55:43 +0200
    Organization: http://onet.pl
    Lines: 26
    Message-ID: <2...@p...null.onet.pl.invalid>
    References: <4...@c...googlegroups.com>
    <2...@p...null.onet.pl.invalid>
    <8...@s...googlegroups.com>
    <2...@p...null.onet.pl.invalid>
    <4...@l...googlegroups.com>
    NNTP-Posting-Host: inet20907ng-3.nat.umts.dynamic.eranet.pl
    Mime-Version: 1.0
    Content-Type: text/plain; charset=ISO-8859-2
    Content-Transfer-Encoding: quoted-printable
    X-Trace: news.onet.pl 1255827358 371 213.158.199.79 (18 Oct 2009 00:55:58 GMT)
    X-Complaints-To: n...@o...pl
    NNTP-Posting-Date: Sun, 18 Oct 2009 00:55:58 +0000 (UTC)
    X-Newsreader: Sylpheed 2.5.0 (GTK+ 2.10.14; i686-pc-mingw32)
    Xref: news-archive.icm.edu.pl pl.comp.programming:183834
    [ ukryj nagłówki ]

    Mariusz Marszałkowski <m...@g...com> wrote:

    > Pewnie najlepiej wypadnie najpierw długość serii + zamiana
    > wartości na pozycję + jakaś metda LZ. Długość serii dekompresuje
    > się błyskawicznie, zamiana wartości na pozycję trochę gorzej,
    > LZ też jest bardzo szybkie.
    >
    > Więc pozostaje pytanie jaką metodą zmienić kolejność rekordów,
    > aby jakoś kompresji była jak najlepsza.

    Przeanalizowałem pierwszy milion rekordów i moje wnioski
    są następujące. Po odrzuceniu niektórych kolumn, liczba
    różnych kombinacji wartości w rekordach jest stosunkowo mała.
    Odrzuciłem kolumny 0, 21, 22 i 23 - liczba kombinacji
    to mniej niż 100 tysięcy. Pewnie jakby odrzucić trochę więcej,
    ta liczba spadłaby (jest już późno, nie chce mi się bawić).

    Więc można wpierw pogrupować rekordy wg tych kombinacji, np.
    wrzucić do hashmapy; od razu znasz wartości 20-kilku kolumn.
    Zaś pozostałe kolumny można już kompresować, albo nawet zapisać
    wprost, pewnie byś się zmieścił w kilku bajtach na rekord.

    dobranoc
    w.

Podziel się

Poleć ten post znajomemu poleć

Wydrukuj ten post drukuj


Następne wpisy z tego wątku

Najnowsze wątki z tej grupy


Najnowsze wątki

Szukaj w grupach

Eksperci egospodarka.pl

1 1 1

Wpisz nazwę miasta, dla którego chcesz znaleźć jednostkę ZUS.

Wzory dokumentów

Bezpłatne wzory dokumentów i formularzy.
Wyszukaj i pobierz za darmo: