-
Data: 2012-05-09 15:14:58
Temat: Re: gry z niepełną informacją i montecarlo
Od: " M.M." <m...@g...pl> szukaj wiadomości tego autora
[ pokaż wszystkie nagłówki ]Edek Pienkowski <e...@g...com> napisał(a):
> Dnia Wed, 09 May 2012 09:58:21 +0000, M.M. napisal:
>
> > Roman W <b...@g...pl> napisaĹ(a):
> >
> >> Podobne problemy czesto rozwiazuje sie w matematyce finansowej. Jezeli
> >> zalozysz, ze gra trwa maksymalnie N ruchow (to chyba jest prawda dla
> >> tysiaca?), to drzewko gry mozesz po prostu przejsc od konca. To powinno
> >> uwzglednic blefy.
> >> Poczytaj o metodach wyceny opcji amerykanskich na drzewach i metoda "least
> >> squares Monte Carlo".
> >
> > MoĹźe gra w tysiÄ ca do wyrobienia sobie wstÄpnego poglÄ du jest nadal zbyt
> > rozbudowana. MoĹźe powinienem posĹuĹźyÄ siÄ jakÄ Ĺ prostszÄ grÄ . Z kole
> i
> > nie wiem czy prostszej grze stosowanie blefĂłw bÄdzie miaĹ jakikolwiek
> > sens...
> >
> > MoĹźe taka gra:
> [...]
> >
> > Jak powinien wyglÄ daÄ algorytm ktĂłry nigdy nie przegra w takÄ grÄ?
> > Interesuje mnie taki algorytm wraz z dowodem matematycznym Ĺźe jest
> > algorytmem optymalnym.
>
> Tit-for-tat przeradza siÄ w tit-for-tat-if-cannot-abuse-opponent.
> W psychologii trudno o dowody formalne.
Zróbmy coś, aby wyeliminować psychologię :)
Można to rozpatrywać w postaci dwuwymiarowej tabeli. W poziomie i
w pionie mamy kolejne programy, a w komórce na skrzyżowaniu
wiersza x z kolumną y mamy wynik jaki uzyskuje program x grając
przeciwko programowi y. Jeśli w komórce jest 100% to znaczy
że x wygra wszystkie gry bez względu na to jak zostały rozdane
karty.
Moje pierwsze pytanie chyba można sprowadzić do tego, czy dla danej
gry istnieje program który ma minimalną wartość 50% ( minimalną, czyli
obojętnie z jakim programem zagra, to uzyskuje 50% lub więcej.).
W różnych grach czynnik blefu może mieć różne skutki. Nie wiem w
tej chwili czy są gry z niepełną informacją w których czynnik blefu
nigdy nie poprawi wyniku. Jeśli takie gry są, to w nich należy grać
optymalnie i należy zakładać że przeciwnik zagra/zagrał optymalnie.
Myślę że dla takich gier istnieją programy które minimalną wartość w
powyższej tabeli będą miały właśnie 50%.
Natomiast dla gier w których blefowanie może pomóc taki algorytm
raczej nie istnieje. Chyba dla każdej strategii blefowania
można napisać taką strategię która osiągnie ponad 50%.
Dobrze myślę czy źle?
Ponadto rodzą się kolejne problemy.
Po pierwsze jak ocenić czy w danej grze czynnik blefu ma duże znaczenie czy
małe? A jeśli już ocenimy jakie ma znaczenie, to jak wpleść w
algorytm choćby jakieś najprostsze szacowanie sposobu blefowania przeciwnika?
W grach karcianych gdy jest już po rozgrywce to dowiadujemy się jakie
karty otrzymał przeciwnik. Pamiętamy także jak dokładał karty. Może należy
zawsze grać optymalnie, a blef oceniać tylko u przeciwnika? Można obliczyć
jak odległa była strategia obrana przez przeciwnika od strategii
optymalnej i zakładać jakąś średnią ważoną z N ostatnich rozdań?
Wydaje się sensowne jeśli program całkowicie zaniecha blefowania a będzie
grał zawsze optymalnie. Jeśli program zdoła oszacować poziom blefowania
przeciwnika (a tym samym poziom umiejętności gry przeciwnika) to zagra
optymalnie do oszacowanego poziomu.
Pozdrawiam
--
Wysłano z serwisu Usenet w portalu Gazeta.pl -> http://www.gazeta.pl/usenet/
Następne wpisy z tego wątku
- 09.05.12 18:43 Edek Pienkowski
- 09.05.12 19:15 Edek Pienkowski
- 10.05.12 03:20 M.M.
- 10.05.12 08:02 Paweł Kierski
- 10.05.12 08:33 voy
- 09.05.12 13:52 Roman W
- 09.05.12 16:15 Roman W
- 15.05.12 17:36 M.M.
- 15.05.12 18:01 Edek Pienkowski
- 15.05.12 19:31 M.M.
- 15.05.12 20:31 Edek Pienkowski
- 17.05.12 14:20 profesor fir
- 17.05.12 16:20 M.M.
- 17.05.12 16:52
- 17.05.12 16:55
Najnowsze wątki z tej grupy
- Can you activate BMW 48V 10Ah Li-Ion battery, connecting to CAN-USB laptop interface ?
- We Wrocławiu ruszyła Odra 5, pierwszy w Polsce komputer kwantowy z nadprzewodzącymi kubitami
- Ada-Europe - AEiC 2025 early registration deadline imminent
- John Carmack twierdzi, że gdyby gry były optymalizowane, to wystarczyły by stare kompy
- Ada-Europe Int.Conf. Reliable Software Technologies, AEiC 2025
- Linuks od wer. 6.15 przestanie wspierać procesory 486 i będzie wymagać min. Pentium
- ,,Polski przemysł jest w stanie agonalnym" - podkreślił dobitnie, wskazując na brak zamówień.
- Rewolucja w debugowaniu!!! SI analizuje zrzuty pamięci systemu M$ Windows!!!
- Brednie w wiki - hasło Dehomag
- Perfidne ataki krakerów z KRLD na skrypciarzy JS i Pajton
- Instytut IDEAS może zacząć działać: "Ma to być unikalny w europejskiej skali ośrodek badań nad sztuczną inteligencją."
- Instytut IDEAS może zacząć działać: "Ma to być unikalny w europejskiej skali ośrodek badań nad sztuczną inteligencją."
- Instytut IDEAS może zacząć działać: "Ma to być unikalny w europejskiej skali ośrodek badań nad sztuczną inteligencją."
- U nas propagują modę na SI, a w Chinach naukowcy SI po kolei umierają w wieku 40-50lat
- C++. Podróż Po Języku - komentarz
Najnowsze wątki
- 2025-07-14 granice
- 2025-07-14 Awaria VM?
- 2025-07-14 Gdańsk => Programista Kotlin <=
- 2025-07-14 Warszawa => Junior Rekruter <=
- 2025-07-14 Warszawa => Specjalista rekrutacji IT <=
- 2025-07-14 Wkłady do zniczy...
- 2025-07-14 Warszawa => Specjalista ds. Sprzętu Komputerowego <=
- 2025-07-14 Re: PO chroniło i chroni policyjnych bandziorów [zawiasy za katowanie obywatela (Poznań czerwiec 2012)]
- 2025-07-14 Warszawa => International Freight Forwarder <=
- 2025-07-14 Warszawa => Recruiter 360 <=
- 2025-07-14 Re: Rz?Âd ZAKAZUJE magazyn?Â?w energii ?!! Nowe prawo od 14 lipca to SZOK! ??Â
- 2025-07-14 Warszawa => Sales Assistant <=
- 2025-07-13 Fałszywe alerty
- 2025-07-12 dlaczego gadacie z tym debilem
- 2025-07-13 Unia Europejska przygotowuje nowy podatek