Što je učenje s potkrepljenjem?

Učenje s pojačanjem je vrsta tehnike strojnog učenja u kojoj algoritam uči donositi odluke putem pokušaja i pogrešaka. Algoritam prima povratne informacije u obliku nagrada ili kazni na temelju radnji koje poduzima i koristi te povratne informacije kako bi naučio kako maksimizirati buduće nagrade. Često se koristi u aplikacijama gdje optimalna odluka nije unaprijed poznata ili kada donošenje odluka zahtijeva adaptivno učenje tijekom vremena. Učenje s potkrepljenjem ima primjenu u područjima kao što su robotika, igre, financije i zdravstvena skrb.

Datum objave: