-
Path: news-archive.icm.edu.pl!agh.edu.pl!news.agh.edu.pl!newsfeed2.atman.pl!newsfeed.
atman.pl!.POSTED!not-for-mail
From: bartekltg <b...@g...com>
Newsgroups: pl.comp.programming
Subject: Re: Zrandomizowane wyszukiwanie binarne
Date: Tue, 30 Sep 2014 11:27:55 +0200
Organization: ATMAN - ATM S.A.
Lines: 85
Message-ID: <m0dt2s$6v4$1@node2.news.atman.pl>
References: <5...@g...com>
<m0cm3a$8r6$1@node1.news.atman.pl>
<b...@g...com>
NNTP-Posting-Host: 89-73-81-145.dynamic.chello.pl
Mime-Version: 1.0
Content-Type: text/plain; charset=UTF-8; format=flowed
Content-Transfer-Encoding: 8bit
X-Trace: node2.news.atman.pl 1412069276 7140 89.73.81.145 (30 Sep 2014 09:27:56 GMT)
X-Complaints-To: u...@a...pl
NNTP-Posting-Date: Tue, 30 Sep 2014 09:27:56 +0000 (UTC)
User-Agent: Mozilla/5.0 (X11; Linux x86_64; rv:31.0) Gecko/20100101
Thunderbird/31.1.2
In-Reply-To: <b...@g...com>
Xref: news-archive.icm.edu.pl pl.comp.programming:206682
[ ukryj nagłówki ]On 30.09.2014 07:20, Wojciech Muła wrote:
> On Tuesday, September 30, 2014 12:22:33 AM UTC+2, bartekltg wrote:
>> Na pewno normalnym? To z jaką wariancją. Jak radzić sobie z wyjściem
>> poza [a,b] (rozkłąd normlany o dowolnej średniej i std jest -inf..inf),
>> co najwyżej odpowiednio doże liczby są w praktyce niemożliwe do
>> wylosowania.
>>
>> Może miałeś na myśli rozkład jednostajny?
>
> Tak, jednostajny. Pomyłka (i to nie imię mojej żony :) ).
>
>> W cormenie na pewno przy wyszukiwaniu binarnym było wyszukiwanie
>> interpolacyjne, natomiast losowy wybór elementu dzielącego
>> był w wersji qsort.
>>
>> Czy gdzieś (np w ćwiczeniach) była wersja wyszukiwania z losowaniem,
>> nie wiem, możesz podać dokładniejsze namiary?
>
> Moja kopia Cormena leży 450 km stąd, dlatego zapytałem.
>
>> [...]
>
> Wielkie dzięki.
>
>> Wersja randomizowana jest też logarytmiczna, ale ciut wolniejsza
>> (jeśli chodzi o liczbę porównań, to tego dojdzie generowani liczb
>> losowych)
>> [...]
>> A, do rzeczy. Skoro algorytm jest wyraźnie gorszy, wątpię, by
>> ktoś o nim coś więcej i dokładniej pisał. Ale mogę czegoś nie
>> zauważać.
>
> Właśnie miałem nadzieję, że ktoś zauważył - np., że dla jakiegoś szczególnego
> rozkładu danych wejściowych wersja randomizowana sprawdza się lepiej.
To najpewniej załatwia ta uwaga:
>> Po policzeniu nie ma w tym nc zaskakującego;) Wzór [1] na T[L]
>> to jakaśtam średnia z fukcji
>> x T(x) + (L-x) T(L-x). [2]
>
>> Ma ona symetrie względem L/s, czyli tam jest ekstermum.
>> Spodziewamy się [pd T(x) funkcji wyglądającej jak logarytm).
>> x log(x) + (L-x)log(L-x) ma w L/2 minimum.
>> Lepiej więc wziąć po prostu L/2, niż średnią (a to, dla wartości
>> oczekiwanej, robimy randomizując punkt podziału).
Może trochę niewyraźnie napisane. I na pewno nieformalne.
Z pierwszym problemem sobie poradzimy;)
Jeszcze raz, wartość oczekiwana czasu obsłużenia tablicy długości
L zadana jest rekurencyjnym wzorem:
T[L] = 1+sum(i=1,L-1) ro(i,L) [T[i] (i)/L + T[L-i]*(L-i)/L]
1 dla porównania jednego elementu,
sum(i=1,L-1) ro(i,L) [...] to średnia z jakiegoś wyrażenia po
rozkładzie o gęstości ro.
a zawartość nawiasu kwadratowego to właśnie nasze wyrażenie,
które się uśrednia. [T[i] (i)/L + T[L-i]*(L-i)/L]
Można pokazać (mniejsza o ścisłość, dla logarytmu działa, chyba
działa dla każdej monotonicznej, wraz z pochodnymi, funkcji), że
przy pewnych założeniach co do T[x], T[x] *x jest wypukła.
Więc [T[x] *(x)/L + T[L-x]*(L-x)/L] też.
Jak poprzednio wspomniałem, jest symetryczna przy x-> L/2 - x
więc ma w L/2 minimum.
Wróćmy do głównego równania. Mamy jakiś rozkład, który uśrednia
funkcję [...]. Ale najmniejszą wartość uzyskamy, jeśli weźmiemy
tylko minimum. Biorąc cokolwiek innego, nawet z małym
prawdopodobieństwem, dostajemy gorszy wynik niż biorąc minimum.
Najmniejsze T wychodzi przy rozkładzie skupionym na środku.
Z drugiej strony, ktoś o tym pisze:
http://www.cise.ufl.edu/~yx1/publications/bin_search
.pdf
ale nie wczytałem się na tyle, by wiedzieć, po co.
pzdr
bartekltg
Następne wpisy z tego wątku
Najnowsze wątki z tej grupy
- Grok zaczął nadużywać wulgaryzmów i wprost obrażać niektóre znane osoby
- Can you activate BMW 48V 10Ah Li-Ion battery, connecting to CAN-USB laptop interface ?
- We Wrocławiu ruszyła Odra 5, pierwszy w Polsce komputer kwantowy z nadprzewodzącymi kubitami
- Ada-Europe - AEiC 2025 early registration deadline imminent
- John Carmack twierdzi, że gdyby gry były optymalizowane, to wystarczyły by stare kompy
- Ada-Europe Int.Conf. Reliable Software Technologies, AEiC 2025
- Linuks od wer. 6.15 przestanie wspierać procesory 486 i będzie wymagać min. Pentium
- ,,Polski przemysł jest w stanie agonalnym" - podkreślił dobitnie, wskazując na brak zamówień.
- Rewolucja w debugowaniu!!! SI analizuje zrzuty pamięci systemu M$ Windows!!!
- Brednie w wiki - hasło Dehomag
- Perfidne ataki krakerów z KRLD na skrypciarzy JS i Pajton
- Instytut IDEAS może zacząć działać: "Ma to być unikalny w europejskiej skali ośrodek badań nad sztuczną inteligencją."
- Instytut IDEAS może zacząć działać: "Ma to być unikalny w europejskiej skali ośrodek badań nad sztuczną inteligencją."
- Instytut IDEAS może zacząć działać: "Ma to być unikalny w europejskiej skali ośrodek badań nad sztuczną inteligencją."
- U nas propagują modę na SI, a w Chinach naukowcy SI po kolei umierają w wieku 40-50lat
Najnowsze wątki
- 2025-07-23 Gdańsk => Programista Delphi <=
- 2025-07-23 Gdańsk => Programista Mainframe (z/OS, Assembler) <=
- 2025-07-23 Warszawa => Starszy inżynier DevOps (AWS) <=
- 2025-07-23 Gdańsk => Mainframe (z/OS, Assembler) Developer <=
- 2025-07-23 Kraków => Senior Fullstack Engineer (Low-Code Platform) <=
- 2025-07-23 Wrocław => Senior Key Account Manager IT <=
- 2025-07-23 Trójmiasto => Head of Social Media <=
- 2025-07-23 Rzeszów => Spedytor Międzynarodowy <=
- 2025-07-23 Lublin => ERP Implementation Consultant (AP Module) <=
- 2025-07-23 Środa Wielkopolska => SAP FI/CO Internal Consultant <=
- 2025-07-23 Warszawa => Inżynier oprogramowania .Net <=
- 2025-07-23 Kraków => Kotlin Developer <=
- 2025-07-23 Żerniki => Dyspozytor Międzynarodowy <=
- 2025-07-23 Warszawa => Java Developer <=
- 2025-07-23 Wrocław => Konsultant wdrożeniowy (systemy controlingowe) <=