-
Path: news-archive.icm.edu.pl!news.gazeta.pl!newsfeed.pionier.net.pl!news.glorb.com!p
ostnews.google.com!d10g2000yqh.googlegroups.com!not-for-mail
From: Mariusz Marszałkowski <m...@g...com>
Newsgroups: pl.comp.programming
Subject: Re: kompresja danych
Date: Sun, 18 Oct 2009 00:37:55 -0700 (PDT)
Organization: http://groups.google.com
Lines: 27
Message-ID: <3...@d...googlegroups.com>
References: <4...@c...googlegroups.com>
<2...@p...null.onet.pl.invalid>
<8...@s...googlegroups.com>
<2...@p...null.onet.pl.invalid>
<4...@l...googlegroups.com>
<2...@p...null.onet.pl.invalid>
NNTP-Posting-Host: 89.229.16.190
Mime-Version: 1.0
Content-Type: text/plain; charset=ISO-8859-2
Content-Transfer-Encoding: quoted-printable
X-Trace: posting.google.com 1255851476 22126 127.0.0.1 (18 Oct 2009 07:37:56 GMT)
X-Complaints-To: g...@g...com
NNTP-Posting-Date: Sun, 18 Oct 2009 07:37:56 +0000 (UTC)
Complaints-To: g...@g...com
Injection-Info: d10g2000yqh.googlegroups.com; posting-host=89.229.16.190;
posting-account=xjvq9QoAAAATMPC2X3btlHd_LkaJo_rj
User-Agent: G2/1.0
X-HTTP-UserAgent: Mozilla/5.0 (Windows; U; Windows NT 5.2; pl; rv:1.9.1.3)
Gecko/20090824 Firefox/3.5.3,gzip(gfe),gzip(gfe)
Xref: news-archive.icm.edu.pl pl.comp.programming:183835
[ ukryj nagłówki ]On 18 Paź, 02:55, Wojciech Muła
<w...@p...null.onet.pl.invalid> wrote:
> Mariusz Marszałkowski <m...@g...com> wrote:
> > Pewnie najlepiej wypadnie najpierw długość serii + zamiana
> > wartości na pozycję + jakaś metda LZ. Długość serii dekompresuje
> > się błyskawicznie, zamiana wartości na pozycję trochę gorzej,
> > LZ też jest bardzo szybkie.
>
> > Więc pozostaje pytanie jaką metodą zmienić kolejność rekordów,
> > aby jakoś kompresji była jak najlepsza.
>
> Przeanalizowałem pierwszy milion rekordów i moje wnioski
> są następujące. Po odrzuceniu niektórych kolumn, liczba
> różnych kombinacji wartości w rekordach jest stosunkowo mała.
> Odrzuciłem kolumny 0, 21, 22 i 23 - liczba kombinacji
> to mniej niż 100 tysięcy. Pewnie jakby odrzucić trochę więcej,
> ta liczba spadłaby (jest już późno, nie chce mi się bawić).
>
> Więc można wpierw pogrupować rekordy wg tych kombinacji, np.
> wrzucić do hashmapy; od razu znasz wartości 20-kilku kolumn.
> Zaś pozostałe kolumny można już kompresować, albo nawet zapisać
> wprost, pewnie byś się zmieścił w kilku bajtach na rekord.
Dziękuję serdecznie.
Następne wpisy z tego wątku
- 17.10.09 14:08 Wiktor S.
- 18.10.09 17:11 Mariusz Marszałkowski
- 19.10.09 13:36 Daniel Janus
Najnowsze wątki z tej grupy
- Do czego nadaje się QDockWidget z bibl. Qt?
- Bibl. Qt jest sztucznie ograniczona - jest nieprzydatna do celów komercyjnych
- Co sciaga kretynow
- AEiC 2024 - Ada-Europe conference - Deadlines Approaching
- Jakie są dobre zasady programowania programów opartych na wtyczkach?
- sprawdzanie słów kluczowych dot. zła
- Re: W czym sie teraz pisze programy??
- Re: (PDF) Surgical Pathology of Non-neoplastic Gastrointestinal Diseases by Lizhi Zhang
- CfC 28th Ada-Europe Int. Conf. Reliable Software Technologies
- Młodzi programiści i tajna policja
- Ada 2022 Language Reference Manual to be Published by Springer
- Press Release - AEiC 2023, Ada-Europe Reliable Softw. Technol.
- Ada-Europe - AEiC 2023 early registration deadline approaching
- Ada-Europe Int.Conf. Reliable Software Technologies, AEiC 2023
- Ile cykli zajmuje mnożenie liczb 64-bitowych?
Najnowsze wątki
- 2024-05-18 Warszawa => Mid PHP Developer (Laravel) <=
- 2024-05-18 Warszawa => Software .Net Developer <=
- 2024-05-18 Warszawa => Mid/Senior QA Engineer <=
- 2024-05-18 Ulm => Solution Architect (sichere Kommunikation und IoT-Loesungen <=
- 2024-05-18 Katowice => Head of Virtualization Platform Management and Operating S
- 2024-05-18 Warszawa => SAP WM Consultant / Execution <=
- 2024-05-18 Wrocław => Consultant/Implementer Comarch ERP XL <=
- 2024-05-18 Gdańsk => Head of International Freight Forwarding Department <=
- 2024-05-18 Warszawa => Account Manager (Recruitment Services) <=
- 2024-05-18 Łódź => Salesperson - CRM Systems <=
- 2024-05-18 Łódź => Handlowiec - Systemy CRM <=
- 2024-05-17 ZŁOMNIK o pracy w TVN TURBO, nowych przepisach i współczesnej motoryzacji. Turbo Taryfa!
- 2024-05-17 Białystok => DevOps Engineer Conexa First (Contractor) <=
- 2024-05-17 Warszawa => Starszy inżynier oprogramowania (Rust) <=
- 2024-05-17 Zabrze => Junior HelpDesk <=