-
Data: 2012-12-05 12:02:28
Temat: Re: Potyczki
Od: "M.M." <m...@g...com> szukaj wiadomości tego autora
[ pokaż wszystkie nagłówki ]W dniu wtorek, 20 listopada 2012 18:23:43 UTC+1 użytkownik slawek napisał:
"Dany jest plik długości 2 gigabajtów (tj. 2*1024*1024*1024). Wśród
wszystkich możliwych podciągów 16-bajtowych (których jest 2**31 - 2^4 + 1,
bo wybieramy kolejne bajty) znaleźć taki, który najczęściej występuje w tym
pliku. Uwaga: dane w pliku /mogą/ być zupełnie przypadkowe, może też cały
plik być wypełniony zerami itd. itp. - wszystkie złośliwe przypadki
dozwolone - tzn. nie wolno zgadywać, trzeba sprawdzić. Premiowane będą
rozwiązania szybkie i oszczędzające pamięć (zakładamy że mamy tylko 512 MB
RAM do dyspozycji)."
Fajne zadanie. Tak od razu po przeczytaniu nie wiem jak je rozwiązać
szybko i zagwarantować dokładny wynik. Heurystycznie bym zrobił kolejkę
priorytetową i dodawał do niej klucze pod-ciągów, a te które wystąpiły
najrzadziej bym wywalał. W 512MB można upakować powiedzmy 60mln
par (klucz,częstość). Podciągów niestety jest 32 razy więcej.
Heurystycznie można jeszcze przejrzeć plik kilka razy, z różnych
offsetów i w rożnych kolejnościach.
Co tam jeszcze może być pomocne... 256MB pamięci RAM to 2G bitów. Można
funkcją hash ustawić bity. Jeśli bit jest ustawiony, a klucza nie ma
w kolejce, to być może klucz został przedwcześnie usunięty z kolejki. Może w
takich sytuacjach należy się cofnąć na początek pliku, policzyć częstość
tylko tego jednego klucza, a jeśli częstość przekroczy minimum jakie jest
w kolejce, to dodać go z powrotem. Zdaje się że taki algorytm przy doskonałej
funkcji hash gwarantuje rozwiązanie. Jednak po pierwsze doskonałej nie da się
zrobić dla każdych danych, a po drugie nawrotów na początek pliku może być
dużo - więc czas obliczeń może być długi. Niby można policzyć kilka razy dla
różnych funkcji hash - ale to też nie zagwarantuje rozwiązania na 100%.
Pozdrawiam
Następne wpisy z tego wątku
- 05.12.12 17:13 e...@g...com
- 05.12.12 18:40 R.e.m.e.K
- 05.12.12 19:42 PK
- 05.12.12 19:45 PK
- 05.12.12 19:56 e...@g...com
- 05.12.12 22:31 PK
- 05.12.12 22:41 e...@g...com
- 05.12.12 23:08 PK
- 09.12.12 23:12 slawek
- 16.12.12 06:24 M.M.
- 19.12.12 21:38 slawek
Najnowsze wątki z tej grupy
- Xiaomi [Chiny - przyp. JMJ] produkuje w całkowitych ciemnościach i bez ludzi
- Prezydent SZAP/USONA Trump ułaskawił prezydenta Hondurasu Hernandeza skazanego na 45 lat więzienia
- Rosjanie chwalą się prototypem komputera kwantowego. "Najważniejszy projekt naukowy Rosji"
- A Szwajcarzy kombinują tak: FinalSpark grows human neurons from stem cells and connects them to electrode arrays
- Re: Najgorszy język programowania
- NOWY: 2025-09-29 Alg., Strukt. Danych i Tech. Prog. - komentarz.pdf
- Na grupie comp.os.linux.advocacy CrudeSausage twierdzi, że Micro$lop używa SI do szyfrowania formatu dok. XML
- Błąd w Sofcie Powodem Wymiany 3 Duńskich Fregat Typu Iver Huitfeldt
- Grok zaczął nadużywać wulgaryzmów i wprost obrażać niektóre znane osoby
- Can you activate BMW 48V 10Ah Li-Ion battery, connecting to CAN-USB laptop interface ?
- We Wrocławiu ruszyła Odra 5, pierwszy w Polsce komputer kwantowy z nadprzewodzącymi kubitami
- Ada-Europe - AEiC 2025 early registration deadline imminent
- John Carmack twierdzi, że gdyby gry były optymalizowane, to wystarczyły by stare kompy
- Ada-Europe Int.Conf. Reliable Software Technologies, AEiC 2025
- Linuks od wer. 6.15 przestanie wspierać procesory 486 i będzie wymagać min. Pentium
Najnowsze wątki
- 2026-01-29 KSeF - 13 wątpliwości
- 2026-01-29 A ja się pochwalę
- 2026-01-29 Warszawa => Mid/Senior IT Recruiter <=
- 2026-01-29 Warszawa => Senior Java Developer <=
- 2026-01-29 Warszawa => IT Recruiter <=
- 2026-01-28 Degradacja
- 2026-01-28 Wysoki Sąd poinstruował czego unikać wyzywając Owsiaka "Równiejszego"
- 2026-01-28 Białystok => Solution Architect (Workday) - Legal Systems <=
- 2026-01-28 Białystok => Preseles Inżynier (background baz danych) <=
- 2026-01-28 Wrocław => Konsultant wdrożeniowy ERP <=
- 2026-01-28 Łódź => Microsoft Engineer <=
- 2026-01-28 Białystok => Tester manualny <=
- 2026-01-27 Tradycja ciągania posłów po sądach za wystąpienia w Sejmie będzie kontynuowana [Lepper 2]
- 2026-01-27 Pierwszy raz sprzedano więcej samochodów zeeletryfikowanych niż ice
- 2026-01-27 Elektryczny Kałasznikow




Jak kupić pierwsze mieszkanie? Eksperci podpowiadają