-
Data: 2012-12-05 12:02:28
Temat: Re: Potyczki
Od: "M.M." <m...@g...com> szukaj wiadomości tego autora
[ pokaż wszystkie nagłówki ]W dniu wtorek, 20 listopada 2012 18:23:43 UTC+1 użytkownik slawek napisał:
"Dany jest plik długości 2 gigabajtów (tj. 2*1024*1024*1024). Wśród
wszystkich możliwych podciągów 16-bajtowych (których jest 2**31 - 2^4 + 1,
bo wybieramy kolejne bajty) znaleźć taki, który najczęściej występuje w tym
pliku. Uwaga: dane w pliku /mogą/ być zupełnie przypadkowe, może też cały
plik być wypełniony zerami itd. itp. - wszystkie złośliwe przypadki
dozwolone - tzn. nie wolno zgadywać, trzeba sprawdzić. Premiowane będą
rozwiązania szybkie i oszczędzające pamięć (zakładamy że mamy tylko 512 MB
RAM do dyspozycji)."
Fajne zadanie. Tak od razu po przeczytaniu nie wiem jak je rozwiązać
szybko i zagwarantować dokładny wynik. Heurystycznie bym zrobił kolejkę
priorytetową i dodawał do niej klucze pod-ciągów, a te które wystąpiły
najrzadziej bym wywalał. W 512MB można upakować powiedzmy 60mln
par (klucz,częstość). Podciągów niestety jest 32 razy więcej.
Heurystycznie można jeszcze przejrzeć plik kilka razy, z różnych
offsetów i w rożnych kolejnościach.
Co tam jeszcze może być pomocne... 256MB pamięci RAM to 2G bitów. Można
funkcją hash ustawić bity. Jeśli bit jest ustawiony, a klucza nie ma
w kolejce, to być może klucz został przedwcześnie usunięty z kolejki. Może w
takich sytuacjach należy się cofnąć na początek pliku, policzyć częstość
tylko tego jednego klucza, a jeśli częstość przekroczy minimum jakie jest
w kolejce, to dodać go z powrotem. Zdaje się że taki algorytm przy doskonałej
funkcji hash gwarantuje rozwiązanie. Jednak po pierwsze doskonałej nie da się
zrobić dla każdych danych, a po drugie nawrotów na początek pliku może być
dużo - więc czas obliczeń może być długi. Niby można policzyć kilka razy dla
różnych funkcji hash - ale to też nie zagwarantuje rozwiązania na 100%.
Pozdrawiam
Następne wpisy z tego wątku
- 05.12.12 17:13 e...@g...com
- 05.12.12 18:40 R.e.m.e.K
- 05.12.12 19:42 PK
- 05.12.12 19:45 PK
- 05.12.12 19:56 e...@g...com
- 05.12.12 22:31 PK
- 05.12.12 22:41 e...@g...com
- 05.12.12 23:08 PK
- 09.12.12 23:12 slawek
- 16.12.12 06:24 M.M.
- 19.12.12 21:38 slawek
Najnowsze wątki z tej grupy
- A Szwajcarzy kombinują tak: FinalSpark grows human neurons from stem cells and connects them to electrode arrays
- Re: Najgorszy język programowania
- NOWY: 2025-09-29 Alg., Strukt. Danych i Tech. Prog. - komentarz.pdf
- Na grupie comp.os.linux.advocacy CrudeSausage twierdzi, że Micro$lop używa SI do szyfrowania formatu dok. XML
- Błąd w Sofcie Powodem Wymiany 3 Duńskich Fregat Typu Iver Huitfeldt
- Grok zaczął nadużywać wulgaryzmów i wprost obrażać niektóre znane osoby
- Can you activate BMW 48V 10Ah Li-Ion battery, connecting to CAN-USB laptop interface ?
- We Wrocławiu ruszyła Odra 5, pierwszy w Polsce komputer kwantowy z nadprzewodzącymi kubitami
- Ada-Europe - AEiC 2025 early registration deadline imminent
- John Carmack twierdzi, że gdyby gry były optymalizowane, to wystarczyły by stare kompy
- Ada-Europe Int.Conf. Reliable Software Technologies, AEiC 2025
- Linuks od wer. 6.15 przestanie wspierać procesory 486 i będzie wymagać min. Pentium
- ,,Polski przemysł jest w stanie agonalnym" - podkreślił dobitnie, wskazując na brak zamówień.
- Rewolucja w debugowaniu!!! SI analizuje zrzuty pamięci systemu M$ Windows!!!
- Brednie w wiki - hasło Dehomag
Najnowsze wątki
- 2025-12-24 Felgi
- 2025-12-24 2,5 x więcej niż Li-Ion
- 2025-12-24 No i kolejny ograniczony
- 2025-12-24 Warszawa => Młodszy Specjalista ds. wsparcia sprzedaży <=
- 2025-12-24 New York Times zagrożeniem bezpieczeństwa narodowego USA - POTUS D. Trump
- 2025-12-24 Podżeganie?
- 2025-12-24 => Senior Algorithm Developer (Java/Kotlin) <=
- 2025-12-24 otwarcie drugiej obwodnicy Trójmiasta
- 2025-12-24 Tfu! Przeklety prostokąt (czyli UPS i "sinus modyfikowany")
- 2025-12-23 Prezent dla kierowców od prezydenta Nawrockiego
- 2025-12-23 Warszawa => Asystent ds. Sprzedaży i Rozwoju Klienta <=
- 2025-12-23 Warszawa => Senior IT Recruitment Consultant <=
- 2025-12-22 czy wiedziałeś że?
- 2025-12-22 Unijne KOOOORWY mówią że WYCOFUJĄ się z zakazu rejestracji elektryków
- 2025-12-22 Białystok => ERP Microsoft Dynamics 365 Commerce Consultant <=




7 pułapek i okazji - zobacz co cię czeka podczas kupna mieszkania na wynajem