-
Path: news-archive.icm.edu.pl!newsfeed.gazeta.pl!feed.news.interia.pl!news.nask.pl!ne
ws.nask.org.pl!goblin1!goblin.stu.neva.ru!postnews.google.com!g23g2000yqh.googl
egroups.com!not-for-mail
From: Mariusz Marszałkowski <m...@g...com>
Newsgroups: pl.sci.ai,pl.comp.programming
Subject: drzewa decyzyjne cdn
Date: Sun, 15 Nov 2009 04:23:50 -0800 (PST)
Organization: http://groups.google.com
Lines: 69
Message-ID: <2...@g...googlegroups.com>
NNTP-Posting-Host: 89.229.16.190
Mime-Version: 1.0
Content-Type: text/plain; charset=ISO-8859-2
Content-Transfer-Encoding: quoted-printable
X-Trace: posting.google.com 1258287830 13644 127.0.0.1 (15 Nov 2009 12:23:50 GMT)
X-Complaints-To: g...@g...com
NNTP-Posting-Date: Sun, 15 Nov 2009 12:23:50 +0000 (UTC)
Complaints-To: g...@g...com
Injection-Info: g23g2000yqh.googlegroups.com; posting-host=89.229.16.190;
posting-account=xjvq9QoAAAATMPC2X3btlHd_LkaJo_rj
User-Agent: G2/1.0
X-HTTP-UserAgent: Mozilla/5.0 (Windows; U; Windows NT 5.2; pl; rv:1.9.1.5)
Gecko/20091102 Firefox/3.5.5,gzip(gfe),gzip(gfe)
Xref: news-archive.icm.edu.pl pl.sci.ai:10942 pl.comp.programming:183928
[ ukryj nagłówki ]Witam
Mam zalążek pomysłu na algorytm budowania drzewa decyzyjnego.
Podejrzewam że
nie ja pierwszy to wymyśliłem, będę więc wdzięczny za linka do
bardziej dopracowanej formy
tego algorytmu i za wszelkie uwagi.
Na początku jest problem z wybraniem struktury drzewa. Nie wiadomo
jaki rozmiar powinno
mieć drzewo i ile powinno mieć liści dla każdej klasy. Chyba trzeba
odgadnąć architekturę
drzewa na podstawie spodziewanych danych.
Gdy już mamy architekturę drzewa, możemy budować klasyfikator.
Najpierw buduejmy
zbiór wszystkich dopuszczalnych reguł. Następnie bierzemy kolejno po
jednym wektorze
uczącym. Sprawdzamy do jakiej klasy należy ten wektor. Wybieramy
losowo (może
jest lepszy sposób niż losowo?) taki liść drzewa decyzyjnego, który
reprezentuje tą samą
klasę do której przynależy wektor uczący. Po ustaleniu liścia tego
wektora, poruszamy
się w drzewie poprzez kolejnych rodziców aż do osiągnięcia korzenia.
Podczas poruszania się
do korzenia, w każdym węźle przeprowadzamy coś w rodzaju głosowania na
wszystkie
reguły z ustalonego na początku zbioru reguł. Głosowanie może wyglądać
np. tak:
1) jesteśmy w węźle X
2) węzeł X ma dwóch potomków Y_1 i Y_2
3) do węzła X dotarliśmy np. z potomka Y_1
4) dla wszystkich reguł R_i :
a) jeśli reguła R_i spowoduje przydzielenie bieżącego wektora do
Y_1 otrzymuje 1 głos ( np. suma = suma + 1 )
b) jeśli reguła R_i spowoduje przydzielenie bieżącego wektora do
Y_2 traci 1 głos (np. suma = suma - 1)
W ten sposób po wyczerpaniu wektorów uczących w każdym węźle byśmy
mieli zestaw reguł i
przypisane tym regułom liczby. Duża liczba oznaczałaby że reguła
często przyczyniała się do
dobrej klasyfikacji, a mała liczba że reguła przyczyniała się rzadko.
Ostatecznie do zbudowania
drzewa decyzyjnego należałoby użyć tych reguł które mają przypisane
największe liczby.
Jeszcze raz podkreślę że to jest zalążek pomysłu, ma on wiele wad i
jest na tym etapie
bardzo niedopracowany. Będę wdzięczny za wszelkie pomysły na
ulepszenie, albo argumenty
na to że taki algorytm jednak nie jest w stanie zbudować dobrego
drzewa decyzyjnego.
Zastanawiam się także czy taki algorytm mógłby pracować online, gdyż w
danej chwili potrzebuje
tylko jednego wektora uczącego.
Pozdrawiam serdecznie.
Następne wpisy z tego wątku
- 09.12.09 21:36 Red Art
- 10.12.09 00:44 Mariusz Marszałkowski
Najnowsze wątki z tej grupy
- A Szwajcarzy kombinują tak: FinalSpark grows human neurons from stem cells and connects them to electrode arrays
- Re: Najgorszy język programowania
- NOWY: 2025-09-29 Alg., Strukt. Danych i Tech. Prog. - komentarz.pdf
- Na grupie comp.os.linux.advocacy CrudeSausage twierdzi, że Micro$lop używa SI do szyfrowania formatu dok. XML
- Błąd w Sofcie Powodem Wymiany 3 Duńskich Fregat Typu Iver Huitfeldt
- Grok zaczął nadużywać wulgaryzmów i wprost obrażać niektóre znane osoby
- Can you activate BMW 48V 10Ah Li-Ion battery, connecting to CAN-USB laptop interface ?
- We Wrocławiu ruszyła Odra 5, pierwszy w Polsce komputer kwantowy z nadprzewodzącymi kubitami
- Ada-Europe - AEiC 2025 early registration deadline imminent
- John Carmack twierdzi, że gdyby gry były optymalizowane, to wystarczyły by stare kompy
- Ada-Europe Int.Conf. Reliable Software Technologies, AEiC 2025
- Linuks od wer. 6.15 przestanie wspierać procesory 486 i będzie wymagać min. Pentium
- ,,Polski przemysł jest w stanie agonalnym" - podkreślił dobitnie, wskazując na brak zamówień.
- Rewolucja w debugowaniu!!! SI analizuje zrzuty pamięci systemu M$ Windows!!!
- Brednie w wiki - hasło Dehomag
Najnowsze wątki
- 2025-12-24 otwarcie drugiej obwodnicy Trójmiasta
- 2025-12-24 Tfu! Przeklety prostokąt (czyli UPS i "sinus modyfikowany")
- 2025-12-23 Prezent dla kierowców od prezydenta Nawrockiego
- 2025-12-23 Warszawa => Asystent ds. Sprzedaży i Rozwoju Klienta <=
- 2025-12-23 Warszawa => Senior IT Recruitment Consultant <=
- 2025-12-22 czy wiedziałeś że?
- 2025-12-22 Unijne KOOOORWY mówią że WYCOFUJĄ się z zakazu rejestracji elektryków
- 2025-12-22 Białystok => ERP Microsoft Dynamics 365 Commerce Consultant <=
- 2025-12-22 Lublin => Project Manager <=
- 2025-12-22 Warszawa => Project Manager (AI and innovation) <=
- 2025-12-22 TVN oczekuje: Za Ziobrem BĘDZIE czerwona nota Interpolu! Czy może Interpol da drugi raz (w) dupę? ;-)
- 2025-12-21 Norweski przepis na pozbywanie się uchodźców odwiedzających kraj z którego "uciekli"
- 2025-12-21 UE bierze kredyt na 90GEUR, by przedłużyć wojnę na Ukrainie, w tym Polska 4-5%, czyli od 3,6 do 4,5GEUR
- 2025-12-21 Produkcja energii w elektrowniach atomowych
- 2025-12-20 No właśnie




7 pułapek i okazji - zobacz co cię czeka podczas kupna mieszkania na wynajem