Hyperparameterinnstilling er prosessen med å velge de beste hyperparametrene for en maskinlæringsmodell, som er konfigurasjonsinnstillinger som ikke læres fra treningsdataene, men i stedet settes av brukeren før opplæring av modellen. Disse parameterne har en betydelig innvirkning på ytelsen til modellen og kan inkludere læringshastighet, antall skjulte lag, antall nevroner i hvert lag, aktiveringsfunksjoner, regulariseringsstyrke og mer. Målet med hyperparameterinnstilling er å finne de beste parameterverdiene som gir høyest nøyaktighet eller laveste feil på validerings- eller testdatasettet. Rutenettsøk, tilfeldig søk og Bayesiansk optimalisering er vanlige teknikker som brukes for hyperparameterinnstilling.
Publiseringsdato: