-
Data: 2013-01-16 10:29:01
Temat: Re: algorytm stringi
Od: "M.M." <m...@g...com> szukaj wiadomości tego autora
[ pokaż wszystkie nagłówki ]W dniu środa, 16 stycznia 2013 09:29:22 UTC+1 użytkownik firr kenobi napisał:
> nie rozumiem, jak wogole wygladalo by
> takie indeksowanie np na przykladzie zaindeksowania 'robinsona cruzoe' (okolo
> 500kb)? robi sie cos w rodzaju slownika/mapy
> ze slowami i offsetami w pliku?
Też nie mam ani szczegółowej wiedzy, ani doświadczeń praktycznych z
tego typu algorytmami. Wyobrażam sobie to mniej/więcej w ten sposób...
Mamy tekst:
char text[M];
Mamy długość prefixa:
const int N = 6;
Mamy parę:
struct Pair {
unsigned int key; // suma-klucz
unsigned int pos; // pozycja w text.
Pair *next;
};
Mamy hash-table:
Pair *hash_table[S];
Mamy klucze, po jednym kluczu dla znaku alfabetu:
const unsigned int keys[256] = {rand,rand...rand};
Inicjujemy hash-table:
unsigned int key = 0;
for( int i=0 ; i<N ; i++ )
key ^= keys[ text[i] ];
for( int i=N ; i<M ; i++ ) {
Pair *pair = new Pair( key , i-N , NULL );
const unsigned int entry = key % S;
insert( pair , hash_table , entry );
key ^= text[i-N] ^ text[i];
}
Potem mamy wzorzec:
char pattern[N+R];
Liczymy klucz:
key = 0;
for( int i=0 ; i<N ; i++ )
key ^= keys[ pattern[i] ];
Liczymy punkt wejścia do hash-table:
entry = hash_table + key % S;
while( entry ) {
print( entry->pos ); // pozycje pod którymi może zaczynać się wyszukiwany tekst
enetry = entry->next;
}
Pozdrawiam
Następne wpisy z tego wątku
- 16.01.13 15:37 firr kenobi
- 16.01.13 15:43 firr kenobi
- 16.01.13 19:36 M.M.
- 17.01.13 18:16 firr kenobi
- 17.01.13 22:11 M.M.
- 20.01.13 14:28 firr kenobi
- 20.01.13 14:37 firr kenobi
Najnowsze wątki z tej grupy
- A Szwajcarzy kombinują tak: FinalSpark grows human neurons from stem cells and connects them to electrode arrays
- Re: Najgorszy język programowania
- NOWY: 2025-09-29 Alg., Strukt. Danych i Tech. Prog. - komentarz.pdf
- Na grupie comp.os.linux.advocacy CrudeSausage twierdzi, że Micro$lop używa SI do szyfrowania formatu dok. XML
- Błąd w Sofcie Powodem Wymiany 3 Duńskich Fregat Typu Iver Huitfeldt
- Grok zaczął nadużywać wulgaryzmów i wprost obrażać niektóre znane osoby
- Can you activate BMW 48V 10Ah Li-Ion battery, connecting to CAN-USB laptop interface ?
- We Wrocławiu ruszyła Odra 5, pierwszy w Polsce komputer kwantowy z nadprzewodzącymi kubitami
- Ada-Europe - AEiC 2025 early registration deadline imminent
- John Carmack twierdzi, że gdyby gry były optymalizowane, to wystarczyły by stare kompy
- Ada-Europe Int.Conf. Reliable Software Technologies, AEiC 2025
- Linuks od wer. 6.15 przestanie wspierać procesory 486 i będzie wymagać min. Pentium
- ,,Polski przemysł jest w stanie agonalnym" - podkreślił dobitnie, wskazując na brak zamówień.
- Rewolucja w debugowaniu!!! SI analizuje zrzuty pamięci systemu M$ Windows!!!
- Brednie w wiki - hasło Dehomag
Najnowsze wątki
- 2025-12-20 No właśnie
- 2025-12-20 Wy tam w sądach jesteście JESZCZE BARDZIEJ POJEBANI
- 2025-12-20 eksplozja cen i kosztów w Polsce
- 2025-12-20 Dalekopis T100 - problem z powrotem karetki
- 2025-12-20 Diody LED - oświetlenie na choinkę
- 2025-12-20 Bieruń => Junior Dynamics 365 Finance Consultant <=
- 2025-12-20 Warszawa => Senior Frontend Developer (React + React Native) <=
- 2025-12-20 Sędzia podrobił testament
- 2025-12-19 Nie widzieć gdzie się jedzie
- 2025-12-19 Wyłączenie sędziego
- 2025-12-19 12 latka zabiła rok młodszą koleżanke w Jeleniej Górze
- 2025-12-19 M. Romanowski JUŻ bez ENA ale dalej z nakazem aresztowania w RP3
- 2025-12-18 ale wiesz, że są gotowce?
- 2025-12-18 Portfel bankiera -- dokąd przenieść?
- 2025-12-18 Warszawa => Inżynier Systemów i Sieci <=




Chińskie auta: Od niskiej jakości do globalnego lidera. Co pokazuje raport EFL?