-
X-Received: by 10.31.41.72 with SMTP id p69mr377131vkp.7.1505694405302; Sun, 17 Sep
2017 17:26:45 -0700 (PDT)
X-Received: by 10.31.41.72 with SMTP id p69mr377131vkp.7.1505694405302; Sun, 17 Sep
2017 17:26:45 -0700 (PDT)
Path: news-archive.icm.edu.pl!news.icm.edu.pl!news.nask.pl!news.nask.org.pl!news.unit
0.net!weretis.net!feeder6.news.weretis.net!feeder.usenetexpress.com!feeder-in1.
iad1.usenetexpress.com!border1.nntp.dca1.giganews.com!border2.nntp.dca1.giganew
s.com!nntp.giganews.com!o200no1844791itg.0!news-out.google.com!x15ni700qth.1!nn
tp.google.com!b1no1852386qtc.1!postnews.google.com!glegroupsg2000goo.googlegrou
ps.com!not-for-mail
Newsgroups: pl.comp.programming
Date: Sun, 17 Sep 2017 17:26:45 -0700 (PDT)
Complaints-To: g...@g...com
Injection-Info: glegroupsg2000goo.googlegroups.com; posting-host=178.36.205.96;
posting-account=xjvq9QoAAAATMPC2X3btlHd_LkaJo_rj
NNTP-Posting-Host: 178.36.205.96
User-Agent: G2/1.0
MIME-Version: 1.0
Message-ID: <4...@g...com>
Subject: sieć neuronowa do uczenia sieci neuronowej
From: "M.M." <m...@g...com>
Injection-Date: Mon, 18 Sep 2017 00:26:45 +0000
Content-Type: text/plain; charset="UTF-8"
Content-Transfer-Encoding: quoted-printable
Lines: 60
Xref: news-archive.icm.edu.pl pl.comp.programming:211516
[ ukryj nagłówki ]
Co prawda to nie jest grupa stricte o sztucznej inteligencji, ale
takowa niemal zamarła, piszą tam z rzadka góra 3-4 osoby; ponadto
temat sztucznej inteligencji (póki co) jest ściśle związany z
algorytmiką, więc chyba można na tę grupę pisać o sieciach
neuronowych, a szczególnie o sztucznych sieciach neuronowych.
Do rzeczy, jakiś czas temu przyszło mi kilka pomysłów do głowy na to,
jak jedną sztuczną sieć neuronową wykorzystać do uczenia drugiej
sztucznej sieci neuronowej. Pomysłami tymi nie chcę się na razie
dzielić, poza jednym wyjątkiem. Ten jeden stricte nie dotyczy uczenia,
ale dotyczy doboru architektury, doboru sposobu inicjalizacji wag,
parametrów uczenia, czasu uczenia, i innych. Pomysł nie jest
przełomowy, wiem że analogiczne zastosowania sztucznych sieci
neuronowych były już w innych dziedzinach, chociażby w optymalizacji
technologii wypiekania ciasteczek. Wpisałem jednak w google i
nic podobnego nie znalazłem, więc postanowiłem ten pomysł opisać
tutaj, ryzykując że już ktoś to opisywał.
Teraz naprawdę do rzeczy. Mamy duże zadanie, dużo danych, prawdopodobnie
będzie do tego zadania potrzebna duża sieć, a więc każda próba uczenia
będzie kosztowna i czasochłonna. Na początku na wyczucie dobieramy
czas uczenia, rozmiary pod-zbiorów uczących, architekturę sieci, sposób
inicjalizacji wag, itd. Przeprowadzamy kilka eksperymentów i sprawdzamy
(kroswalidacja) jakie uzyskaliśmy wyniki na zbiorach testowych. Następnie
na wejście drugiej (dużo mniejszej) sieci podajemy wyniki ze zbiorów
testowych, a na wyjście dajemy właśnie czas uczenia, rozmiary pod-zbiorów,
architekturę, inicjalizację, itd. Potem oczywiście uczymy drugą sieć.
W końcu na wejście sieci dajemy wartość 100%, bo na zbiorach walidacyjnych
chcemy mieć właśnie skuteczność 100%. Druga sieć na wyjściu zaproponuje
nowy czas uczenia, nowe podziały na pod-zbiory, nową architekturę itd.
Pierwszą sieć, o ile odpowiedź drugiej sieci nie jest całkowicie
nonsensowna, uczymy według propozycji drugiej sieci. W ten sposób
uzyskamy kolejne dane uczące dla drugiej sieci. Cały proces zapętlamy.
Będę wdzięczny za uwagi.
Pozdrawiam
Następne wpisy z tego wątku
Najnowsze wątki z tej grupy
- Bibl. Qt jest sztucznie ograniczona - jest nieprzydatna do celów komercyjnych
- Co sciaga kretynow
- AEiC 2024 - Ada-Europe conference - Deadlines Approaching
- Jakie są dobre zasady programowania programów opartych na wtyczkach?
- sprawdzanie słów kluczowych dot. zła
- Re: W czym sie teraz pisze programy??
- Re: (PDF) Surgical Pathology of Non-neoplastic Gastrointestinal Diseases by Lizhi Zhang
- CfC 28th Ada-Europe Int. Conf. Reliable Software Technologies
- Młodzi programiści i tajna policja
- Ada 2022 Language Reference Manual to be Published by Springer
- Press Release - AEiC 2023, Ada-Europe Reliable Softw. Technol.
- Ada-Europe - AEiC 2023 early registration deadline approaching
- Ada-Europe Int.Conf. Reliable Software Technologies, AEiC 2023
- Ile cykli zajmuje mnożenie liczb 64-bitowych?
- Ideologia Polskiego Programisty wer.3
Najnowsze wątki
- 2024-05-03 Warszawa => Sprzedawca usług rekrutacyjnych <=
- 2024-05-03 Warszawa => Mid/Senior QA Engineer <=
- 2024-05-03 Warszawa => Mid/Senior QA Engineer <=
- 2024-05-03 Warszawa => Senior PHP Developer (Symfony) <=
- 2024-05-03 Rzeszów => UX/UI Designer <=
- 2024-05-03 Giertych przetarł szlak: byli członkowie zarządu Orlenu śledztwa prokuratorskie obserwują z zagranicy
- 2024-05-03 Warszawa => Senior Rust Software Engineer <=
- 2024-05-03 Kraków => UX/UI Designer <=
- 2024-05-03 Warszawa => International freight forwarder <=
- 2024-05-02 Silnik Stirlinga - energia mechaniczna wytwarzana z ciepła bez dostarczania paliwa!
- 2024-05-02 Kraków => Senior .Net Programmer <=
- 2024-05-02 Sprowadzenie pożaru zagrażającego mieniu w wielkich rozmiarch
- 2024-05-02 Zielona Góra => Spedytor międzynarodowy <=
- 2024-05-02 Katowice => Performance Analyst <=
- 2024-05-02 Gdańsk => Full Stack web developer (obszar .Net Core, Angular6+) <=