-
Path: news-archive.icm.edu.pl!news.icm.edu.pl!news.cyf-kr.edu.pl!not-for-mail
From: Sc0rpi0 <s...@f...polbox.pl>
Newsgroups: pl.comp.programming
Subject: Re: Taki sobie programik - czy ju? jest napisany?
Date: Mon, 19 Jul 2010 02:23:34 +0200
Organization: ScoSys
Lines: 37
Message-ID: <i2058f$juf$1@srv.cyf-kr.edu.pl>
References: <4c3f6ed1$0$17083$65785112@news.neostrada.pl>
<1...@4...com> <i1q5vj$hm2$1@news.onet.pl>
Reply-To: s...@p...com
NNTP-Posting-Host: rap.fema.krakow.pl
Mime-Version: 1.0
Content-Type: text/plain; charset=iso-8859-2
Content-Transfer-Encoding: 8Bit
X-Trace: srv.cyf-kr.edu.pl 1279498319 20431 195.150.11.173 (19 Jul 2010 00:11:59 GMT)
X-Complaints-To: n...@c...edu.pl
NNTP-Posting-Date: Mon, 19 Jul 2010 00:11:59 +0000 (UTC)
User-Agent: KNode/0.7.2
Xref: news-archive.icm.edu.pl pl.comp.programming:186057
[ ukryj nagłówki ]Jacek Czerwinski nabazgrolił(a):
> Odcinanie bym widzial jesli da sie zapewnic sortowanie A i B np. po
> nazwie lub innym atrybucie bedacym elementem porownania.
W sumie skoro i tak musimy sprawdzić całe A to chyba niepotrzebne jest
całkowite porównywanie zawartości, spokojnie wystarczy sprawdzanie
skrótów jakichś X bajtów pliku i dopiero gdy to okaże się być spełnione
porównanie po kolei wielkości i w końcu zawartości plików.
Mając skrót kilkubajtowy, plus jakiś mały znacznik, o który plik chodzi
i nieprzesadną ilość plików do sprawdzenia to spokojnie całość można
w pamięci nawet trzymać. Trzeba wtedy przelecieć A i zrobić tablicę
skrótów+indeksów i tylko to posortować. Np. jeżeli skróty wielkości
dajmy na to 12 bajtów, 4 bajtowy wskaźnik/indeks pliku i z milion
plików do sprawdzenia na przenośnym to jest to raptem 16MB tablicy.
Oczywiście takie podejście to konieczność najpierw przelecenia po A
na pendrivie i zrobienia tej tablicy. Potem już tylko jechać po kolei
po wszystkich plikach B, skrót tych X bajtów, próba jego znalezienia
w posortowanej tablicy (to nic nie jest). Nie ma, to dalej, a jest to
sprawdzenie wielkości pliku i jak się zgadza to dopiero porównanie
zawartości i ew. akcja "znaleziono duplikat".
> Jesli kursorem A poszedlem za daleko w stosunku do B, nie ma sensu isc
> dalej, teraz nadganiamy B.
> Ale chyba naturalny interfejs pozyskiwania zawartosci katalogu nie ma
> sortowania sortowania (znam windows).
Tyle, że po nazwie nie ma sensu sortować, bo po zawartości porównujemy.
--
Sc0rpi0 - [...] jakiś dziwak rzucał im pocięte kawałki drutu. Powiedziałem,
że [...] nie jadają tego. -Nie zależy mi na tym, by go jadły - odparł, [...]
-Ale mogą się udławić, [...] -Nie udławią się, bo drut tonie. [...]
-Więc po co pan rzuca ? Bo lubię karmić łabędzie.
Najnowsze wątki z tej grupy
- We Wrocławiu ruszyła Odra 5, pierwszy w Polsce komputer kwantowy z nadprzewodzącymi kubitami
- Ada-Europe - AEiC 2025 early registration deadline imminent
- John Carmack twierdzi, że gdyby gry były optymalizowane, to wystarczyły by stare kompy
- Ada-Europe Int.Conf. Reliable Software Technologies, AEiC 2025
- Linuks od wer. 6.15 przestanie wspierać procesory 486 i będzie wymagać min. Pentium
- ,,Polski przemysł jest w stanie agonalnym" - podkreślił dobitnie, wskazując na brak zamówień.
- Rewolucja w debugowaniu!!! SI analizuje zrzuty pamięci systemu M$ Windows!!!
- Brednie w wiki - hasło Dehomag
- Perfidne ataki krakerów z KRLD na skrypciarzy JS i Pajton
- Instytut IDEAS może zacząć działać: "Ma to być unikalny w europejskiej skali ośrodek badań nad sztuczną inteligencją."
- Instytut IDEAS może zacząć działać: "Ma to być unikalny w europejskiej skali ośrodek badań nad sztuczną inteligencją."
- Instytut IDEAS może zacząć działać: "Ma to być unikalny w europejskiej skali ośrodek badań nad sztuczną inteligencją."
- U nas propagują modę na SI, a w Chinach naukowcy SI po kolei umierają w wieku 40-50lat
- C++. Podróż Po Języku - komentarz
- "Wuj dobra rada" z KDAB rozważa: Choosing the Right Programming Language for Your Embedded Linux Device
Najnowsze wątki
- 2025-06-24 Gdynia => Przedstawiciel handlowy / KAM (branża TSL) <=
- 2025-06-24 Warszawa => Młodszy Programista SQL / FrontEnd developer <=
- 2025-06-24 Warszawa => Junior C# / FrontEnd developer <=
- 2025-06-24 Warszawa => Sales Executive / KAM <=
- 2025-06-23 Warszawa => MENA New Business Manager <=
- 2025-06-23 Trójmiasto => Head of Social Media <=
- 2025-06-23 Tapeta w Xiaomi
- 2025-06-23 Gdańsk => Programista Kotlin <=
- 2025-06-23 Białystok => Programista Mainframe (z/OS, Assembler) <=
- 2025-06-23 Warszawa => Senior Account Manager <=
- 2025-06-23 Białystok => Mainframe (z/OS, Assembler) Developer <=
- 2025-06-23 Warszawa => Starszy Programista C <=
- 2025-06-23 Warszawa => Tester Automatyzujący <=
- 2025-06-23 Warszawa => Inżynier oprogramowania .Net <=
- 2025-06-23 Warszawa => Programista Full Stack .Net <=