-
Path: news-archive.icm.edu.pl!news.icm.edu.pl!news.cyf-kr.edu.pl!not-for-mail
From: Sc0rpi0 <s...@f...polbox.pl>
Newsgroups: pl.comp.programming
Subject: Re: Taki sobie programik - czy ju? jest napisany?
Date: Mon, 19 Jul 2010 02:23:34 +0200
Organization: ScoSys
Lines: 37
Message-ID: <i2058f$juf$1@srv.cyf-kr.edu.pl>
References: <4c3f6ed1$0$17083$65785112@news.neostrada.pl>
<1...@4...com> <i1q5vj$hm2$1@news.onet.pl>
Reply-To: s...@p...com
NNTP-Posting-Host: rap.fema.krakow.pl
Mime-Version: 1.0
Content-Type: text/plain; charset=iso-8859-2
Content-Transfer-Encoding: 8Bit
X-Trace: srv.cyf-kr.edu.pl 1279498319 20431 195.150.11.173 (19 Jul 2010 00:11:59 GMT)
X-Complaints-To: n...@c...edu.pl
NNTP-Posting-Date: Mon, 19 Jul 2010 00:11:59 +0000 (UTC)
User-Agent: KNode/0.7.2
Xref: news-archive.icm.edu.pl pl.comp.programming:186057
[ ukryj nagłówki ]Jacek Czerwinski nabazgrolił(a):
> Odcinanie bym widzial jesli da sie zapewnic sortowanie A i B np. po
> nazwie lub innym atrybucie bedacym elementem porownania.
W sumie skoro i tak musimy sprawdzić całe A to chyba niepotrzebne jest
całkowite porównywanie zawartości, spokojnie wystarczy sprawdzanie
skrótów jakichś X bajtów pliku i dopiero gdy to okaże się być spełnione
porównanie po kolei wielkości i w końcu zawartości plików.
Mając skrót kilkubajtowy, plus jakiś mały znacznik, o który plik chodzi
i nieprzesadną ilość plików do sprawdzenia to spokojnie całość można
w pamięci nawet trzymać. Trzeba wtedy przelecieć A i zrobić tablicę
skrótów+indeksów i tylko to posortować. Np. jeżeli skróty wielkości
dajmy na to 12 bajtów, 4 bajtowy wskaźnik/indeks pliku i z milion
plików do sprawdzenia na przenośnym to jest to raptem 16MB tablicy.
Oczywiście takie podejście to konieczność najpierw przelecenia po A
na pendrivie i zrobienia tej tablicy. Potem już tylko jechać po kolei
po wszystkich plikach B, skrót tych X bajtów, próba jego znalezienia
w posortowanej tablicy (to nic nie jest). Nie ma, to dalej, a jest to
sprawdzenie wielkości pliku i jak się zgadza to dopiero porównanie
zawartości i ew. akcja "znaleziono duplikat".
> Jesli kursorem A poszedlem za daleko w stosunku do B, nie ma sensu isc
> dalej, teraz nadganiamy B.
> Ale chyba naturalny interfejs pozyskiwania zawartosci katalogu nie ma
> sortowania sortowania (znam windows).
Tyle, że po nazwie nie ma sensu sortować, bo po zawartości porównujemy.
--
Sc0rpi0 - [...] jakiś dziwak rzucał im pocięte kawałki drutu. Powiedziałem,
że [...] nie jadają tego. -Nie zależy mi na tym, by go jadły - odparł, [...]
-Ale mogą się udławić, [...] -Nie udławią się, bo drut tonie. [...]
-Więc po co pan rzuca ? Bo lubię karmić łabędzie.
Najnowsze wątki z tej grupy
- Brednie w wiki - hasło Dehomag
- Perfidne ataki krakerów z KRLD na skrypciarzy JS i Pajton
- Instytut IDEAS może zacząć działać: "Ma to być unikalny w europejskiej skali ośrodek badań nad sztuczną inteligencją."
- Instytut IDEAS może zacząć działać: "Ma to być unikalny w europejskiej skali ośrodek badań nad sztuczną inteligencją."
- Instytut IDEAS może zacząć działać: "Ma to być unikalny w europejskiej skali ośrodek badań nad sztuczną inteligencją."
- U nas propagują modę na SI, a w Chinach naukowcy SI po kolei umierają w wieku 40-50lat
- C++. Podróż Po Języku - komentarz
- "Wuj dobra rada" z KDAB rozważa: Choosing the Right Programming Language for Your Embedded Linux Device
- Nowa ustawa o ochronie praw autorskich - opis problemu i szkic ustawy
- Alg. kompresji LZW
- Popr. 14. Nauka i Praca Programisty C++ w III Rzeczy (pospolitej)
- Arch. Prog. Nieuprzywilejowanych w pełnej wer. na nowej s. WWW energokod.pl
- 7. Raport Totaliztyczny: Sprawa Qt Group wer. 424
- TCL - problem z escape ostatniego \ w nawiasach {}
- Nauka i Praca Programisty C++ w III Rzeczy (pospolitej)
Najnowsze wątki
- 2025-05-06 Agregat z lodówki olej
- 2025-05-06 Wrocław => Konsultant wdrożeniowy (systemy controlingowe) <=
- 2025-05-06 Warszawa => Senior Node.js Developer (doświadczenie z framework Nest.
- 2025-05-06 Dęblin => Node.js / Fullstack Developer <=
- 2025-05-06 Warszawa => IT Business Analyst (projects in the telco sector) <=
- 2025-05-06 Title: The Economics and Systemic Implications of Bitcoin: Cost, Scarcity, and the Institutional Race for Dominance .
- 2025-05-06 SMSy
- 2025-05-06 Kraków => MS Dynamics 365BC/NAV Developer <=
- 2025-05-06 Warszawa => Strategic Account Manager <=
- 2025-05-06 Warszawa => Senior Frontend Developer (React + React Native) <=
- 2025-05-06 Gdynia => ML Ops Engineer <=
- 2025-05-06 Drobne umowy o dzielo z przeniesieniem praw autorskich
- 2025-05-06 wydobywanie Bitcoinów jest aktualnie zajęciem po prostu nieopłacalnym. Jak wynika z opublikowanych danych, średni koszt wygenerowania jednego Bitcoina wynosi ok. 137 tysięcy dolarów.
- 2025-05-06 Join Bitcoin Blockchain Nonce Global University
- 2025-05-06 Gdynia => ML Ops Engineer <=