Speci: Tanulorendszerek I - koglist

9 Sep 1998

Kedves Erdeklodok!
Az Informatika Tanszekcsoport eloadasai kereteben meghirdetesre kerul
a kovetkezo specialkollegium:
TANULORENDSZEREK I.
Bevezetes a megerositeses tanulas (RL) elmeletebe es gyakorlataba
Eloado: Lorincz Andras (http://iserv.iki.kfki.hu/New/pub.html)
Jelentkezes: alorincz(a)mail.matav.hu
1. Bevezetes (RL helye a tanulasi algoritmusok kozott, HUMAN SZINTU
EREDMENYEK sakkban, backgammonban, szabalyozasban)
2. Kiertekelo visszacsatolas
3. Az RL problema (Az ugynok-kornyezet interface, Celok es jutalmak, Markov
dontesi folyamatok, Ertekfuggveny, Optimalis ertekfuggveny)
4. Dinamikus programozas (Politika kiertekelese, Politika javitasa,
Politika iteralasa, Ertek iteracio, Altalanositott politika-iteracio)
5. Monte Carlo modszerek
6. Konnekcionista eszkozok (Perceptron es a Delta-szabaly, Tobbretegu
perceptron es a visszaterjeszteses tanulas, Informaciot orzo ritka
reprezentacio)
7. Idodifferenciak (TD) modszere (Veges allapotter problemaja, TD
predikcio, a TD modszerek elonyei, Ritka reprezentacio es linearis
approximacio)
8. Alkalmazasok (TD-gammon, Liftrendszer, TD-sakk, Folytonos feladatok)
9. Modularis RL (A "kosarlabdazo" Khepera, Fogalomalkotas -
allapotabsztrakcio)
10. Kitekintes: tanulorendszerek II (Biologiai relevancia, Neuroprotezis
vakoknak es suketeknek, Mesterseges rendszerek IQ-ja?)
AJANLOTT:
programozo matematikusoknak,
matematikusoknak,
fizikusoknak,
vegyeszeknek.
Szukseges: alapfoku linearis algebra es alapfoku valoszinusegszamitasi
ismeretek
Az eloadassorozat alapjat R.S. Sutton es A.G. Barto "Reinforcement
Learning: An Introduction" (Bradford Book, MIT Press, Cambridge 1998)
konyve kepezi. A konyv kivonatos valtozata elerheto Sutton honlapjan
(http://www-anw.cs.umass.edu/~rich/)
Udvozlettel,
Lorincz Andras