-
Path: news-archive.icm.edu.pl!news.gazeta.pl!newsfeed.pionier.net.pl!news.nask.pl!new
s.nask.org.pl!news.onet.pl!not-for-mail
From: Wojciech Muła <w...@p...null.onet.pl.invalid>
Newsgroups: pl.comp.programming
Subject: Re: kompresja danych
Date: Sun, 18 Oct 2009 02:55:43 +0200
Organization: http://onet.pl
Lines: 26
Message-ID: <2...@p...null.onet.pl.invalid>
References: <4...@c...googlegroups.com>
<2...@p...null.onet.pl.invalid>
<8...@s...googlegroups.com>
<2...@p...null.onet.pl.invalid>
<4...@l...googlegroups.com>
NNTP-Posting-Host: inet20907ng-3.nat.umts.dynamic.eranet.pl
Mime-Version: 1.0
Content-Type: text/plain; charset=ISO-8859-2
Content-Transfer-Encoding: quoted-printable
X-Trace: news.onet.pl 1255827358 371 213.158.199.79 (18 Oct 2009 00:55:58 GMT)
X-Complaints-To: n...@o...pl
NNTP-Posting-Date: Sun, 18 Oct 2009 00:55:58 +0000 (UTC)
X-Newsreader: Sylpheed 2.5.0 (GTK+ 2.10.14; i686-pc-mingw32)
Xref: news-archive.icm.edu.pl pl.comp.programming:183834
[ ukryj nagłówki ]Mariusz Marszałkowski <m...@g...com> wrote:
> Pewnie najlepiej wypadnie najpierw długość serii + zamiana
> wartości na pozycję + jakaś metda LZ. Długość serii dekompresuje
> się błyskawicznie, zamiana wartości na pozycję trochę gorzej,
> LZ też jest bardzo szybkie.
>
> Więc pozostaje pytanie jaką metodą zmienić kolejność rekordów,
> aby jakoś kompresji była jak najlepsza.
Przeanalizowałem pierwszy milion rekordów i moje wnioski
są następujące. Po odrzuceniu niektórych kolumn, liczba
różnych kombinacji wartości w rekordach jest stosunkowo mała.
Odrzuciłem kolumny 0, 21, 22 i 23 - liczba kombinacji
to mniej niż 100 tysięcy. Pewnie jakby odrzucić trochę więcej,
ta liczba spadłaby (jest już późno, nie chce mi się bawić).
Więc można wpierw pogrupować rekordy wg tych kombinacji, np.
wrzucić do hashmapy; od razu znasz wartości 20-kilku kolumn.
Zaś pozostałe kolumny można już kompresować, albo nawet zapisać
wprost, pewnie byś się zmieścił w kilku bajtach na rekord.
dobranoc
w.
Następne wpisy z tego wątku
- 18.10.09 07:37 Mariusz Marszałkowski
- 17.10.09 14:08 Wiktor S.
- 18.10.09 17:11 Mariusz Marszałkowski
- 19.10.09 13:36 Daniel Janus
Najnowsze wątki z tej grupy
- Do czego nadaje się QDockWidget z bibl. Qt?
- Bibl. Qt jest sztucznie ograniczona - jest nieprzydatna do celów komercyjnych
- Co sciaga kretynow
- AEiC 2024 - Ada-Europe conference - Deadlines Approaching
- Jakie są dobre zasady programowania programów opartych na wtyczkach?
- sprawdzanie słów kluczowych dot. zła
- Re: W czym sie teraz pisze programy??
- Re: (PDF) Surgical Pathology of Non-neoplastic Gastrointestinal Diseases by Lizhi Zhang
- CfC 28th Ada-Europe Int. Conf. Reliable Software Technologies
- Młodzi programiści i tajna policja
- Ada 2022 Language Reference Manual to be Published by Springer
- Press Release - AEiC 2023, Ada-Europe Reliable Softw. Technol.
- Ada-Europe - AEiC 2023 early registration deadline approaching
- Ada-Europe Int.Conf. Reliable Software Technologies, AEiC 2023
- Ile cykli zajmuje mnożenie liczb 64-bitowych?
Najnowsze wątki
- 2024-05-18 Warszawa => Mid PHP Developer (Laravel) <=
- 2024-05-18 Warszawa => Software .Net Developer <=
- 2024-05-18 Warszawa => Mid/Senior QA Engineer <=
- 2024-05-18 Ulm => Solution Architect (sichere Kommunikation und IoT-Loesungen <=
- 2024-05-18 Katowice => Head of Virtualization Platform Management and Operating S
- 2024-05-18 Warszawa => SAP WM Consultant / Execution <=
- 2024-05-18 Wrocław => Consultant/Implementer Comarch ERP XL <=
- 2024-05-18 Gdańsk => Head of International Freight Forwarding Department <=
- 2024-05-18 Warszawa => Account Manager (Recruitment Services) <=
- 2024-05-18 Łódź => Salesperson - CRM Systems <=
- 2024-05-18 Łódź => Handlowiec - Systemy CRM <=
- 2024-05-17 ZŁOMNIK o pracy w TVN TURBO, nowych przepisach i współczesnej motoryzacji. Turbo Taryfa!
- 2024-05-17 Białystok => DevOps Engineer Conexa First (Contractor) <=
- 2024-05-17 Warszawa => Starszy inżynier oprogramowania (Rust) <=
- 2024-05-17 Zabrze => Junior HelpDesk <=