-
X-Received: by 10.50.13.130 with SMTP id h2mr310212igc.16.1358347079841; Wed, 16 Jan
2013 06:37:59 -0800 (PST)
X-Received: by 10.50.13.130 with SMTP id h2mr310212igc.16.1358347079841; Wed, 16 Jan
2013 06:37:59 -0800 (PST)
Path: news-archive.icm.edu.pl!agh.edu.pl!news.agh.edu.pl!newsfeed2.atman.pl!newsfeed.
atman.pl!news.supermedia.pl!plix.pl!newsfeed2.plix.pl!feed.xsnews.nl!border-2.a
ms.xsnews.nl!feeder1.cambriumusenet.nl!feed.tweaknews.nl!209.197.12.246.MISMATC
H!nx02.iad01.newshosting.com!newshosting.com!69.16.185.11.MISMATCH!npeer01.iad.
highwinds-media.com!news.highwinds-media.com!feed-me.highwinds-media.com!ld4no2
139668pbb.0!news-out.google.com!s9ni26pbb.0!nntp.google.com!f6no2104290pbd.1!po
stnews.google.com!glegroupsg2000goo.googlegroups.com!not-for-mail
Newsgroups: pl.comp.programming
Date: Wed, 16 Jan 2013 06:37:59 -0800 (PST)
In-Reply-To: <4...@g...com>
Complaints-To: g...@g...com
Injection-Info: glegroupsg2000goo.googlegroups.com; posting-host=46.134.95.44;
posting-account=Sb6m8goAAABbWsBL7gouk3bfLsuxwMgN
NNTP-Posting-Host: 46.134.95.44
References: <kceu17$8cf$1@node1.news.atman.pl>
<c...@g...com>
<kckmci$3s2$1@node1.news.atman.pl>
<f...@g...com>
<4...@g...com>
<6...@g...com>
<c...@g...com>
<9...@g...com>
<1...@g...com>
<2...@g...com>
<4...@g...com>
User-Agent: G2/1.0
MIME-Version: 1.0
Message-ID: <e...@g...com>
Subject: Re: algorytm stringi
From: firr kenobi <p...@g...com>
Injection-Date: Wed, 16 Jan 2013 14:38:00 +0000
Content-Type: text/plain; charset=ISO-8859-2
Content-Transfer-Encoding: quoted-printable
X-Received-Bytes: 4454
Xref: news-archive.icm.edu.pl pl.comp.programming:201680
[ ukryj nagłówki ]W dniu środa, 16 stycznia 2013 10:29:01 UTC+1 użytkownik M.M. napisał:
> W dniu środa, 16 stycznia 2013 09:29:22 UTC+1 użytkownik firr kenobi napisał:
>
> > nie rozumiem, jak wogole wygladalo by
>
> > takie indeksowanie np na przykladzie zaindeksowania 'robinsona cruzoe' (okolo
>
> > 500kb)? robi sie cos w rodzaju slownika/mapy
>
> > ze slowami i offsetami w pliku?
>
>
>
> Też nie mam ani szczegółowej wiedzy, ani doświadczeń praktycznych z
>
> tego typu algorytmami. Wyobrażam sobie to mniej/więcej w ten sposób...
>
>
>
> Mamy tekst:
>
> char text[M];
>
>
>
> Mamy długość prefixa:
>
> const int N = 6;
>
>
>
> Mamy parę:
>
> struct Pair {
>
> unsigned int key; // suma-klucz
>
> unsigned int pos; // pozycja w text.
>
> Pair *next;
>
> };
>
>
>
> Mamy hash-table:
>
> Pair *hash_table[S];
>
>
>
> Mamy klucze, po jednym kluczu dla znaku alfabetu:
>
> const unsigned int keys[256] = {rand,rand...rand};
>
>
>
> Inicjujemy hash-table:
>
> unsigned int key = 0;
>
> for( int i=0 ; i<N ; i++ )
>
> key ^= keys[ text[i] ];
>
> for( int i=N ; i<M ; i++ ) {
>
> Pair *pair = new Pair( key , i-N , NULL );
>
> const unsigned int entry = key % S;
>
> insert( pair , hash_table , entry );
>
> key ^= text[i-N] ^ text[i];
>
> }
>
>
>
> Potem mamy wzorzec:
>
> char pattern[N+R];
>
>
>
> Liczymy klucz:
>
> key = 0;
>
> for( int i=0 ; i<N ; i++ )
>
> key ^= keys[ pattern[i] ];
>
>
>
> Liczymy punkt wejścia do hash-table:
>
> entry = hash_table + key % S;
>
> while( entry ) {
>
> print( entry->pos ); // pozycje pod którymi może zaczynać się wyszukiwany tekst
>
> enetry = entry->next;
>
> }
>
Ni do konca rozumiem niestaty co tu sie robi,
moze jakis komentarz szczegolowy? co to jest pattern?
nie wiem czy budowanie drzewa z pojedynczych liter czy bajtow (np w przypadku
indeksowani tresci robinsona kruzoe) mieloby jakies spore walory co do uzytecznosci
bo to drzewo byloby zaiste wielkie tj 'roztyte' (jak ja ostatnio bo pysk mi
ostatnio nieststy utył)
Pewnie mozna takie drzewo zbudowac ale byloby bolaste - zapewne kilka (iles) razy
wieksze od oryginalnego pliku, no i trzebe by przebudowywac przy zmianach (ogolnie np
obrabianie 100 k oryginalnych danych i np 900k
indeksu nie wydaje sie zbyt praktyczne),
ale w pewnych przypadkach jak moze przy kompresji itp moze sie przydac - nie wiem
nie interesowalem sie tym :/
Następne wpisy z tego wątku
- 16.01.13 15:43 firr kenobi
- 16.01.13 19:36 M.M.
- 17.01.13 18:16 firr kenobi
- 17.01.13 22:11 M.M.
- 20.01.13 14:28 firr kenobi
- 20.01.13 14:37 firr kenobi
Najnowsze wątki z tej grupy
- Xiaomi [Chiny - przyp. JMJ] produkuje w całkowitych ciemnościach i bez ludzi
- Prezydent SZAP/USONA Trump ułaskawił prezydenta Hondurasu Hernandeza skazanego na 45 lat więzienia
- Rosjanie chwalą się prototypem komputera kwantowego. "Najważniejszy projekt naukowy Rosji"
- A Szwajcarzy kombinują tak: FinalSpark grows human neurons from stem cells and connects them to electrode arrays
- Re: Najgorszy język programowania
- NOWY: 2025-09-29 Alg., Strukt. Danych i Tech. Prog. - komentarz.pdf
- Na grupie comp.os.linux.advocacy CrudeSausage twierdzi, że Micro$lop używa SI do szyfrowania formatu dok. XML
- Błąd w Sofcie Powodem Wymiany 3 Duńskich Fregat Typu Iver Huitfeldt
- Grok zaczął nadużywać wulgaryzmów i wprost obrażać niektóre znane osoby
- Can you activate BMW 48V 10Ah Li-Ion battery, connecting to CAN-USB laptop interface ?
- We Wrocławiu ruszyła Odra 5, pierwszy w Polsce komputer kwantowy z nadprzewodzącymi kubitami
- Ada-Europe - AEiC 2025 early registration deadline imminent
- John Carmack twierdzi, że gdyby gry były optymalizowane, to wystarczyły by stare kompy
- Ada-Europe Int.Conf. Reliable Software Technologies, AEiC 2025
- Linuks od wer. 6.15 przestanie wspierać procesory 486 i będzie wymagać min. Pentium
Najnowsze wątki
- 2026-01-13 To nie koniec
- 2026-01-13 Warszawa => Recruiter 360 <=
- 2026-01-13 Katowice => Key Account Manager <=
- 2026-01-13 Warszawa => Senior Backend Java Developer <=
- 2026-01-13 Wrocław => ERP Implementation Consultant <=
- 2026-01-13 Elektryk a otwieranie drzwi :-)
- 2026-01-12 Schemat automatyki
- 2026-01-12 Xiaomi [Chiny - przyp. JMJ] produkuje w całkowitych ciemnościach i bez ludzi
- 2026-01-12 Polska Grupa Zbrojeniowa (85% udziałów) Likwiduje Stomil-Poznań - Zakład Działał Od 1928r.
- 2026-01-12 Teoretyczne zagadnienie - ogrzewanie budynku
- 2026-01-12 Xiaomi [Chiny - przyp. JMJ] produkuje w całkowitych ciemnościach i bez ludzi
- 2026-01-12 Xiaomi [Chiny - przyp. JMJ] produkuje w całkowitych ciemnościach i bez ludzi
- 2026-01-12 Polska Grupa Zbrojeniowa (85% udziałów) Likwiduje Stomil-Poznań - Zakład Działał Od 1928r.
- 2026-01-12 Xiaomi [Chiny - przyp. JMJ] produkuje w całkowitych ciemnościach i bez ludzi
- 2026-01-12 Usunięcie zdjęcia zamordowanej kobiety: Policja 3 dni nie zawracała sądowi dupy i załatwiła bez sądu [TVN donosi na kogoś]




5 Najlepszych Programów do Księgowości w Chmurze - Ranking i Porównanie [2025]