-
Path: news-archive.icm.edu.pl!news.icm.edu.pl!newsfeed2.atman.pl!newsfeed.atman.pl!.P
OSTED!not-for-mail
From: bartekltg <b...@g...com>
Newsgroups: pl.comp.programming
Subject: Re: Algorytmy rozproszone
Date: Tue, 18 Oct 2016 00:03:22 +0200
Organization: ATMAN - ATM S.A.
Lines: 60
Message-ID: <nu3hra$ba2$1@node2.news.atman.pl>
References: <3...@g...com>
NNTP-Posting-Host: 89-70-119-159.dynamic.chello.pl
Mime-Version: 1.0
Content-Type: text/plain; charset=utf-8; format=flowed
Content-Transfer-Encoding: 8bit
X-Trace: node2.news.atman.pl 1476741802 11586 89.70.119.159 (17 Oct 2016 22:03:22
GMT)
X-Complaints-To: u...@a...pl
NNTP-Posting-Date: Mon, 17 Oct 2016 22:03:22 +0000 (UTC)
User-Agent: Mozilla/5.0 (X11; Linux x86_64; rv:45.0) Gecko/20100101
Thunderbird/45.3.0
In-Reply-To: <3...@g...com>
Xref: news-archive.icm.edu.pl pl.comp.programming:209951
[ ukryj nagłówki ]On 17.10.2016 21:29, M.M. wrote:
> Mamy proste zadanie, najprościej można je wyrazić zapytaniem sql:
>
> select * from table offset N limit M order by kryteria;
>
> Czyli trzeba wyświetlić rekordy począwszy od N+1 do N+M włącznie
> licząc zgodnie z jakimś kierunkiem sortowania - łatwizna. Cała
> trudność jednak polega na tym, że dane są rozproszone na K
> maszynach. Jaki jest do tego najszybszy algorytm? M raczej będzie
> małe, N może być bardzo duże, K też może być bardzo duże, np.
> M < 200, N > 10^9, K > 50.
Zrzut myśli w stylu grupowym;-)
Można odpytywać komputer o liczbę elementów mniejszych od x.
Znajdujemy takie x, aby suma zwróconych liczb dawała N
(odpowiednio M+N dla y), wtedy pytamy o przesłanie elementów
większych od x a mniejszych od y.
Uwaga na < i <= (w poście się tym nie przejomwałem;>) oraz
na przypadek gdy elementy się powtarzają.
Takie zapytania można robić równolegle, na raz pytając o cały
zestaw różnych xów. Ciut mniej pytań.
Wymaga logatytmicznie wielu następujących po sobie
zapytań do kompów / odpowiedzi. Prawie na pewno wolne.
Wysyłając po 100 zapyrtań/liczb wystarczy 5 zapytań...
Wymaga pewnie jakiś założeń o statystycznym rozkładzie danych.
Jeśli wszytkie obeikty są skupione w neiwiellu wartośćiach,
leżymy.
Można poprosić kopmputery o rozkłąd danych, np wszystkie decyle,
percentyle (tak, wygoglalem, jak nazywają się kwantyle rzedzu 100)
Na ich podstawie centralny komputer wyznacza zakres, w którym
znajduje sie interesujacy przedział.
Jeśli z 50 komputerów dostaniemy percentyle, dostaję
50 ciągów liczb, z których możesz wyznaczyć licby x1 i x2,
takie ze conajmniej i co najwyżej N liczb jest na lewo.
pozycje x1 i x2 będą się różnić o co najwyżej
N/100*K
Hmm, znów mizernie,, chyba, że przesyłamy znacznie więcej danych
(np 1000 liczb).
Za to jedno ułatwienie się pokazuje. Nie trzeba znać przedziału
do wycięcia bardzo dokładnie, byleby wysłąne zapytanie
zawierało interesujący przedział i nie było zbyt duże,
nadmiar obetniesz na kompue pytającym.
pzdr
bartekltg
Następne wpisy z tego wątku
- 18.10.16 05:16 M.M.
Najnowsze wątki z tej grupy
- Bibl. Qt jest sztucznie ograniczona - jest nieprzydatna do celów komercyjnych
- Co sciaga kretynow
- AEiC 2024 - Ada-Europe conference - Deadlines Approaching
- Jakie są dobre zasady programowania programów opartych na wtyczkach?
- sprawdzanie słów kluczowych dot. zła
- Re: W czym sie teraz pisze programy??
- Re: (PDF) Surgical Pathology of Non-neoplastic Gastrointestinal Diseases by Lizhi Zhang
- CfC 28th Ada-Europe Int. Conf. Reliable Software Technologies
- Młodzi programiści i tajna policja
- Ada 2022 Language Reference Manual to be Published by Springer
- Press Release - AEiC 2023, Ada-Europe Reliable Softw. Technol.
- Ada-Europe - AEiC 2023 early registration deadline approaching
- Ada-Europe Int.Conf. Reliable Software Technologies, AEiC 2023
- Ile cykli zajmuje mnożenie liczb 64-bitowych?
- Ideologia Polskiego Programisty wer.3
Najnowsze wątki
- 2024-05-02 Silnik Stirlinga - energia mechaniczna wytwarzana z ciepła bez dostarczania paliwa!
- 2024-05-02 Kraków => Senior .Net Programmer <=
- 2024-05-02 Sprowadzenie pożaru zagrażającego mieniu w wielkich rozmiarch
- 2024-05-02 Zielona Góra => Spedytor międzynarodowy <=
- 2024-05-02 Katowice => Performance Analyst <=
- 2024-05-02 Gdańsk => Full Stack web developer (obszar .Net Core, Angular6+) <=
- 2024-05-02 Gdańsk => Business Development Manager - obszar bezpieczeństwa IT <=
- 2024-05-02 Warszawa => Starszy inżynier oprogramowania (Rust) <=
- 2024-05-02 Katowice => Java Developer <=
- 2024-05-02 'Studenci do nauki!'
- 2024-05-02 Dlaczego energia elektryczna jest droga i cały czas drożeje
- 2024-05-02 Dlaczego energia elektryczna jest droga i cały czas drożeje
- 2024-05-02 Dlaczego energia elektryczna jest droga i cały czas drożeje
- 2024-05-02 Wrocław => Lider Serwisu/Programista PLC z językiem niemieckim <=
- 2024-05-02 Łódź => Senior DevOps Engineer <=