-
Path: news-archive.icm.edu.pl!agh.edu.pl!news.agh.edu.pl!news.cyf-kr.edu.pl!news.nask
.pl!news.nask.org.pl!newsfeed.pionier.net.pl!newsfeed.fsmpi.rwth-aachen.de!news
feed.straub-nv.de!feed.xsnews.nl!fbe001.ams.xsnews.nl!peer02.fr7!news.highwinds
-media.com!newsfeed.neostrada.pl!unt-exc-02.news.neostrada.pl!unt-spo-b-01.news
.neostrada.pl!news.neostrada.pl.POSTED!not-for-mail
Date: Mon, 04 Apr 2016 14:05:21 +0200
From: mk <reverse_lp.pw@myzskm>
User-Agent: Mozilla/5.0 (Windows NT 5.1; rv:24.0) Gecko/20100101 Thunderbird/24.6.0
MIME-Version: 1.0
Newsgroups: pl.comp.programming
Subject: Negamax with alpha beta pruning and transposition tables
Content-Type: text/plain; charset=UTF-8; format=flowed
Content-Transfer-Encoding: 8bit
Lines: 75
Message-ID: <57025882$0$639$65785112@news.neostrada.pl>
Organization: Telekomunikacja Polska
NNTP-Posting-Host: host-178-216-93-110.sta.tvknaszapraca.pl
X-Trace: 1459771522 unt-rea-b-01.news.neostrada.pl 639 178.216.93.110:4536
X-Complaints-To: a...@n...neostrada.pl
X-Received-Bytes: 4505
X-Received-Body-CRC: 1321624178
Xref: news-archive.icm.edu.pl pl.comp.programming:209235
[ ukryj nagłówki ]Próbuję zaimplementować możliwie efektywnie algorytm rozwiązujący pewien
problem sprowadzający się do gry o sumie stałej pomiędzy dwoma
przeciwnikami.
W pierwszym kroku zaimplementowałem algorytm min-max (w postaci negamax).
W moim problemie do danego stanu gry (transpozycji) można dojść czasami
na wiele różnych sposobów więc by przyśpieszyć działanie algorytmu
zastosowałem "memoryzację" czyli zapamiętuję już przeanalizowane stany
gry (transpozycje) i wykorzystuję taki wpis jeśli ponownie natrafię na
wcześniej przeanalizowaną transpozycję. Obliczenia znacząco
przyśpieszyły, wyniki zgodne, jak dotąd dobrze...
Obok, wzbogaciłem też algorytm negamax (bez memoryzacji) o alpha-beta
prunning. No i też OK: obliczenia przyśpieszyły, wyniki zgodne, jak
dotąd dobrze...
Dalej, chcę połączyć alpha-beta prunning z memoryzacją... Zaświtało mi w
głowie, że to będzie bardziej skomplikowane niż na początku by się mogło
wydawać... ale od czego Internet, poszukajmy jak zrobili to inni i
natrafiłem na artykuł Wikipedii:
https://en.wikipedia.org/wiki/Negamax#Negamax_with_a
lpha_beta_pruning_and_transposition_tables
Zaimplementowałem u siebie algorytm przedstawiony w Wikipedii i niestety
zacząłem otrzymywać wyniki niezgodne z trzema uprzednio przedstawionymi
metodami.
W dyskusji dotyczącej artykułu jedna z osób narzeka, że i u niej
algorytm z Wikipedii nie działa, inna osoba jednak kontruje, że algorytm
jest na pewno poprawny, a wina jest po stronie niewłaściwego
zaimplementowania tegoż algorytmu.
Spędziłem jeszcze trochę czasu na poszukiwaniach innych opisów
alpha-beta prunning with memorization, ale nic lepszego niż to co w
Wikipedii nie znalazłem.
Próbuję więc samodzielnie przemyśleć problem i w pełni go zrozumieć...
W algorytmie z Wiki w tablicy transpozycji dodatkowo zapisywana jest
flaga, która przyjmuje stany: UPPERBOUND, LOWERBOUND, EXACT.
Moim zdaniem to jednak za mało informacji by móc rozstrzygnąć czy można
taki wpis w przyszłości wykorzystać.
Moim zdaniem trzeba zapisać w tablicy transpozycji parametry alpha
(alphaOrig wg algorytmu Wiki) i beta przy jakich został obliczony wynik
gry dla danej transpozycji.
Zapamiętuję więc dla każdej transpozycji parametry alpha i beta (bardzo
niechętnie bo pożerają pamięć).
Gdy natrafię ponownie na daną transpozycję dokonuję sprawdzenia czy
alpha_current >= alpha_memorized oraz czy beta_current <= beta_memorized.
Z obliczonej uprzednio wartości korzystam tylko wtedy, gdy oba powyższe
warunki są spełnione. No i chyba działa... tj. wyniki zgodne oraz
otrzymałem najszybszą wersję algorytmu.
Pozostają jednak wątpliwości czy nie da się tu czasem czegoś ulepszyć:
np. gdy nie da się użyć wartości z tablicy transpozycji to być może da
się jakoś zmodyfikować parametr alpha lub beta by uzyskać lepszą
wydajność. Algorytm z Wiki ma coś takiego:
if ttEntry.Flag = EXACT
return ttEntry.Value
else if ttEntry.Flag = LOWERBOUND
? := max( ?, ttEntry.Value)
else if ttEntry.Flag = UPPERBOUND
? := min( ?, ttEntry.Value)
endif
if ? >= ?
return ttEntry.Value
Cały czas też się zastanawiam, czy faktycznie nie wystarczy wspomniana w
Wiki flaga, zamiast pełnej informacji alpha, beta.
Różne próby robione "na macanta" dają jednak niepoprawne wyniki...
Jak powinien wyglądać algorytm alpha beta prunning z memoryzacją?
Może jednak ten z Wiki jest dobry, a ja popełniam błąd w implementacji?
pzdr
mk
Następne wpisy z tego wątku
Najnowsze wątki z tej grupy
- We Wrocławiu ruszyła Odra 5, pierwszy w Polsce komputer kwantowy z nadprzewodzącymi kubitami
- Ada-Europe - AEiC 2025 early registration deadline imminent
- John Carmack twierdzi, że gdyby gry były optymalizowane, to wystarczyły by stare kompy
- Ada-Europe Int.Conf. Reliable Software Technologies, AEiC 2025
- Linuks od wer. 6.15 przestanie wspierać procesory 486 i będzie wymagać min. Pentium
- ,,Polski przemysł jest w stanie agonalnym" - podkreślił dobitnie, wskazując na brak zamówień.
- Rewolucja w debugowaniu!!! SI analizuje zrzuty pamięci systemu M$ Windows!!!
- Brednie w wiki - hasło Dehomag
- Perfidne ataki krakerów z KRLD na skrypciarzy JS i Pajton
- Instytut IDEAS może zacząć działać: "Ma to być unikalny w europejskiej skali ośrodek badań nad sztuczną inteligencją."
- Instytut IDEAS może zacząć działać: "Ma to być unikalny w europejskiej skali ośrodek badań nad sztuczną inteligencją."
- Instytut IDEAS może zacząć działać: "Ma to być unikalny w europejskiej skali ośrodek badań nad sztuczną inteligencją."
- U nas propagują modę na SI, a w Chinach naukowcy SI po kolei umierają w wieku 40-50lat
- C++. Podróż Po Języku - komentarz
- "Wuj dobra rada" z KDAB rozważa: Choosing the Right Programming Language for Your Embedded Linux Device
Najnowsze wątki
- 2025-06-16 Zasilacz impulsowy 12V 10A, coś godnego uwagi jako zamiennik akumulatora wkrętarki
- 2025-06-16 Warszawa => Team Lead Data Engineer (obszar Snowflake) <=
- 2025-06-16 Warszawa => Software Engineer .Net <=
- 2025-06-16 Warszawa => Inżynier oprogramowania .Net <=
- 2025-06-16 Warszawa => IT Data Analyst (Power BI) <=
- 2025-06-16 Warszawa => Spedytor Międzynarodowy <=
- 2025-06-16 Gdynia => MLOps Engineer <=
- 2025-06-16 Środa Wielkopolska => Konsultant wewnętrzny SAP FI/CO <=
- 2025-06-16 Wrocław => Konsultant wdrożeniowy (systemy controlingowe) <=
- 2025-06-16 Warszawa => Dyrektor Sprzedaży (rozwiązania Cloud) <=
- 2025-06-16 Re: Płonie 3000 elektryków u wybrzeży Alaski
- 2025-06-16 Re: Tesla z najnowszym FSD potrafi przejechać dziecko i... pojechać dalej.
- 2025-06-15 Re: Kolejny expierd usiłuje wmówić błąd pilota wadliwego Boeinga
- 2025-06-14 Re: Boeing, który rozbił się w Indiach to był latający złom, bez serwisowania [złom,bo,Air,India,v.,złom,bo,Boening]
- 2025-06-14 Re: Boeing, który rozbił się w Indiach to był latający złom, bez serwisowania [złom,bo,Air,India,v.,złom,bo,Boening]