-
Data: 2017-09-18 02:26:45
Temat: sieć neuronowa do uczenia sieci neuronowej
Od: "M.M." <m...@g...com> szukaj wiadomości tego autora
[ pokaż wszystkie nagłówki ]
Co prawda to nie jest grupa stricte o sztucznej inteligencji, ale
takowa niemal zamarła, piszą tam z rzadka góra 3-4 osoby; ponadto
temat sztucznej inteligencji (póki co) jest ściśle związany z
algorytmiką, więc chyba można na tę grupę pisać o sieciach
neuronowych, a szczególnie o sztucznych sieciach neuronowych.
Do rzeczy, jakiś czas temu przyszło mi kilka pomysłów do głowy na to,
jak jedną sztuczną sieć neuronową wykorzystać do uczenia drugiej
sztucznej sieci neuronowej. Pomysłami tymi nie chcę się na razie
dzielić, poza jednym wyjątkiem. Ten jeden stricte nie dotyczy uczenia,
ale dotyczy doboru architektury, doboru sposobu inicjalizacji wag,
parametrów uczenia, czasu uczenia, i innych. Pomysł nie jest
przełomowy, wiem że analogiczne zastosowania sztucznych sieci
neuronowych były już w innych dziedzinach, chociażby w optymalizacji
technologii wypiekania ciasteczek. Wpisałem jednak w google i
nic podobnego nie znalazłem, więc postanowiłem ten pomysł opisać
tutaj, ryzykując że już ktoś to opisywał.
Teraz naprawdę do rzeczy. Mamy duże zadanie, dużo danych, prawdopodobnie
będzie do tego zadania potrzebna duża sieć, a więc każda próba uczenia
będzie kosztowna i czasochłonna. Na początku na wyczucie dobieramy
czas uczenia, rozmiary pod-zbiorów uczących, architekturę sieci, sposób
inicjalizacji wag, itd. Przeprowadzamy kilka eksperymentów i sprawdzamy
(kroswalidacja) jakie uzyskaliśmy wyniki na zbiorach testowych. Następnie
na wejście drugiej (dużo mniejszej) sieci podajemy wyniki ze zbiorów
testowych, a na wyjście dajemy właśnie czas uczenia, rozmiary pod-zbiorów,
architekturę, inicjalizację, itd. Potem oczywiście uczymy drugą sieć.
W końcu na wejście sieci dajemy wartość 100%, bo na zbiorach walidacyjnych
chcemy mieć właśnie skuteczność 100%. Druga sieć na wyjściu zaproponuje
nowy czas uczenia, nowe podziały na pod-zbiory, nową architekturę itd.
Pierwszą sieć, o ile odpowiedź drugiej sieci nie jest całkowicie
nonsensowna, uczymy według propozycji drugiej sieci. W ten sposób
uzyskamy kolejne dane uczące dla drugiej sieci. Cały proces zapętlamy.
Będę wdzięczny za uwagi.
Pozdrawiam
Następne wpisy z tego wątku
Najnowsze wątki z tej grupy
- Do czego nadaje się QDockWidget z bibl. Qt?
- Bibl. Qt jest sztucznie ograniczona - jest nieprzydatna do celów komercyjnych
- Co sciaga kretynow
- AEiC 2024 - Ada-Europe conference - Deadlines Approaching
- Jakie są dobre zasady programowania programów opartych na wtyczkach?
- sprawdzanie słów kluczowych dot. zła
- Re: W czym sie teraz pisze programy??
- Re: (PDF) Surgical Pathology of Non-neoplastic Gastrointestinal Diseases by Lizhi Zhang
- CfC 28th Ada-Europe Int. Conf. Reliable Software Technologies
- Młodzi programiści i tajna policja
- Ada 2022 Language Reference Manual to be Published by Springer
- Press Release - AEiC 2023, Ada-Europe Reliable Softw. Technol.
- Ada-Europe - AEiC 2023 early registration deadline approaching
- Ada-Europe Int.Conf. Reliable Software Technologies, AEiC 2023
- Ile cykli zajmuje mnożenie liczb 64-bitowych?
Najnowsze wątki
- 2024-05-26 O co chodzi?
- 2024-05-26 PJ autobus-tramwaj
- 2024-05-26 Renault Trafic i lampka z czerwonym STOP
- 2024-05-26 cena pięciocyfrowa
- 2024-05-26 Re: Jak dobra KE "okrada" złą Rosję "dla Ukrainy"
- 2024-05-25 supercap
- 2024-05-25 Sulzbach => Technischer Rollouter (d/m/w) <=
- 2024-05-25 Warszawa => Senior Account Manager <=
- 2024-05-25 Warszawa => Mid PHP Developer (Laravel) <=
- 2024-05-25 Warszawa => Mid PHP Developer (Laravel) <=
- 2024-05-25 Warszawa => Interactive/Experience Designer <=
- 2024-05-25 Warszawa => Key Account Manager <=
- 2024-05-25 Warszawa => SAP WM Consultant / Execution <=
- 2024-05-25 Warszawa => Key Account Manager <=
- 2024-05-25 Re: znów ten wrocław