-
Path: news-archive.icm.edu.pl!news.rmf.pl!agh.edu.pl!news.agh.edu.pl!news.onet.pl!not
-for-mail
From: Wojciech Muła <w...@p...null.onet.pl.invalid>
Newsgroups: pl.comp.programming
Subject: Re: kompresja danych
Date: Sat, 17 Oct 2009 23:42:54 +0200
Organization: http://onet.pl
Lines: 21
Message-ID: <2...@p...null.onet.pl.invalid>
References: <4...@c...googlegroups.com>
<2...@p...null.onet.pl.invalid>
<8...@s...googlegroups.com>
NNTP-Posting-Host: inet20907ng-3.nat.umts.dynamic.eranet.pl
Mime-Version: 1.0
Content-Type: text/plain; charset=ISO-8859-2
Content-Transfer-Encoding: quoted-printable
X-Trace: news.onet.pl 1255815784 10102 213.158.199.79 (17 Oct 2009 21:43:04 GMT)
X-Complaints-To: n...@o...pl
NNTP-Posting-Date: Sat, 17 Oct 2009 21:43:04 +0000 (UTC)
X-Newsreader: Sylpheed 2.5.0 (GTK+ 2.10.14; i686-pc-mingw32)
Xref: news-archive.icm.edu.pl pl.comp.programming:183832
[ ukryj nagłówki ]Mariusz Marszałkowski <m...@g...com> wrote:
> > Nie słyszałem o niczym takim. A co masz w tych wierszach?
> > Te wiersze się powtarzają?
>
> Np. jest 30 kolumn i 20mln wierszy. Dane często wyglądają tak,
> jakby sąsiadujące wiersze miały z dużym prawdopodobieństwem
> te sam wartości w kolumnach. Np. w kolumnie 3-ciej od wiersza
> 100 do 200 są same jedynki, w kolumnie 2 od wiersza 50 do 150
> są same zera. Wszystkie dane to mały podzbiór liczb całkowitych,
> powiedzmy o mocy kilkuset elementów.
Jakbyś pokazał przykładowe kilka tysięcy wierszy, to można
by coś konkretnego doradzić. RLE pewnie coś da, tylko nie
wiadomo czy dla wszystkich kolumn tak samo. Może pomogłaby
jakaś transformacja danych na poziomie kolumn albo wierszy.
Pytanie takie: spróbowałeś z istniejącymi bibliotekami
do kompresji, jak gzip, libzip, lzo? Może się sprawdzą.
w.
Następne wpisy z tego wątku
- 17.10.09 22:05 Mariusz Marszałkowski
- 18.10.09 00:55 Wojciech Muła
- 18.10.09 07:37 Mariusz Marszałkowski
- 17.10.09 14:08 Wiktor S.
- 18.10.09 17:11 Mariusz Marszałkowski
- 19.10.09 13:36 Daniel Janus
Najnowsze wątki z tej grupy
- A Szwajcarzy kombinują tak: FinalSpark grows human neurons from stem cells and connects them to electrode arrays
- Re: Najgorszy język programowania
- NOWY: 2025-09-29 Alg., Strukt. Danych i Tech. Prog. - komentarz.pdf
- Na grupie comp.os.linux.advocacy CrudeSausage twierdzi, że Micro$lop używa SI do szyfrowania formatu dok. XML
- Błąd w Sofcie Powodem Wymiany 3 Duńskich Fregat Typu Iver Huitfeldt
- Grok zaczął nadużywać wulgaryzmów i wprost obrażać niektóre znane osoby
- Can you activate BMW 48V 10Ah Li-Ion battery, connecting to CAN-USB laptop interface ?
- We Wrocławiu ruszyła Odra 5, pierwszy w Polsce komputer kwantowy z nadprzewodzącymi kubitami
- Ada-Europe - AEiC 2025 early registration deadline imminent
- John Carmack twierdzi, że gdyby gry były optymalizowane, to wystarczyły by stare kompy
- Ada-Europe Int.Conf. Reliable Software Technologies, AEiC 2025
- Linuks od wer. 6.15 przestanie wspierać procesory 486 i będzie wymagać min. Pentium
- ,,Polski przemysł jest w stanie agonalnym" - podkreślił dobitnie, wskazując na brak zamówień.
- Rewolucja w debugowaniu!!! SI analizuje zrzuty pamięci systemu M$ Windows!!!
- Brednie w wiki - hasło Dehomag
Najnowsze wątki
- 2025-12-26 Gdańsk => ERP Microsoft Dynamics 365 Commerce Consultant <=
- 2025-12-26 Kraków => Konsultant Microsoft Dynamics 365 Finance <=
- 2025-12-26 Kraków => Microsoft Dynamics 365 Finance Consultant <=
- 2025-12-26 wymieniłem termostat
- 2025-12-26 Warszawa => Senior Backend Java Developer <=
- 2025-12-25 Finlandia przywraca swastykę
- 2025-12-25 Skuteczność wymiaru sprawiedliwości
- 2025-12-24 Felgi
- 2025-12-24 2,5 x więcej niż Li-Ion
- 2025-12-24 No i kolejny ograniczony
- 2025-12-24 Warszawa => Młodszy Specjalista ds. wsparcia sprzedaży <=
- 2025-12-24 New York Times zagrożeniem bezpieczeństwa narodowego USA - POTUS D. Trump
- 2025-12-24 Podżeganie?
- 2025-12-24 => Senior Algorithm Developer (Java/Kotlin) <=
- 2025-12-24 otwarcie drugiej obwodnicy Trójmiasta




7 pułapek i okazji - zobacz co cię czeka podczas kupna mieszkania na wynajem