Els hiperparàmetres de l'aprenentatge automàtic són aquells paràmetres que l'usuari defineix explícitament per controlar el procés d'aprenentatge. Aquests hiperparàmetres s'utilitzen per millorar l'aprenentatge del model, i els seus valors s'estableixen abans d'iniciar el procés d'aprenentatge del model.
En aquest tema, parlarem d'un dels conceptes més importants de l'aprenentatge automàtic, és a dir, els hiperparàmetres, els seus exemples, l'ajustament d'hiperparàmetres, categories d'hiperparàmetres, com és diferent l'hiperparàmetre del paràmetre en l'aprenentatge automàtic? Però abans de començar, primer entenem l'Hiperparàmetre.
Què són els hiperparàmetres?
A Machine Learning/Deep Learning, un model està representat pels seus paràmetres. En canvi, un procés d'entrenament implica seleccionar els hiperparàmetres millors/òptims que utilitzen els algorismes d'aprenentatge per proporcionar el millor resultat. Aleshores, quins són aquests hiperparàmetres? La resposta és, ' Els hiperparàmetres es defineixen com els paràmetres que l'usuari defineix explícitament per controlar el procés d'aprenentatge.'
Aquí el prefix 'hiper' suggereix que els paràmetres són paràmetres de primer nivell que s'utilitzen per controlar el procés d'aprenentatge. L'enginyer d'aprenentatge automàtic selecciona i defineix el valor de l'hiperparàmetre abans que l'algorisme d'aprenentatge comenci a entrenar el model. Per tant, aquests són externs al model i els seus valors no es poden canviar durant el procés d'entrenament .
java té el següent
Alguns exemples d'hiperparàmetres en aprenentatge automàtic
- L'algorisme k en kNN o K-Nearest Neighbor
- Taxa d'aprenentatge per entrenar una xarxa neuronal
- Relació de divisió tren-prova
- Mida del lot
- Nombre d'Èpoques
- Branques a l'arbre de decisions
- Nombre de clústers en l'algoritme de clúster
Diferència entre paràmetre i hiperparàmetre?
Sempre hi ha una gran confusió entre els paràmetres i els hiperparàmetres o els hiperparàmetres del model. Així doncs, per tal d'aclarir aquesta confusió, entenem la diferència entre tots dos i com es relacionen entre ells.
Paràmetres del model:
Els paràmetres del model són variables de configuració internes al model i un model les aprèn per si mateix. Per exemple , W Pesos o coeficients de variables independents en el model de regressió lineal . o Pesos o coeficients de variables independents en SVM, pes i biaixos d'una xarxa neuronal, centroide de clúster en agrupació. Alguns punts clau per als paràmetres del model són els següents:
- Són utilitzats pel model per fer prediccions.
- S'aprenen pel model a partir de les dades mateixes
- Normalment no es configuren manualment.
- Aquestes són la part del model i la clau d'un algorisme d'aprenentatge automàtic.
Hiperparàmetres del model:
Els hiperparàmetres són aquells paràmetres que l'usuari defineix explícitament per controlar el procés d'aprenentatge. Alguns punts clau per als paràmetres del model són els següents:
- Aquests solen ser definits manualment per l'enginyer d'aprenentatge automàtic.
- No es pot saber el millor valor exacte dels hiperparàmetres per al problema donat. El millor valor es pot determinar per la regla general o per assaig i error.
- Alguns exemples d'hiperparàmetres són la taxa d'aprenentatge per entrenar una xarxa neuronal, K a l'algorisme KNN,
Categories d'hiperparàmetres
A grans trets, els hiperparàmetres es poden dividir en dues categories, que es donen a continuació:
Hiperparàmetre per a l'optimització
El procés de selecció dels millors hiperparàmetres per utilitzar es coneix com a sintonització d'hiperparàmetres, i el procés d'ajust també es coneix com a optimització d'hiperparàmetres. Els paràmetres d'optimització s'utilitzen per optimitzar el model.
Alguns dels paràmetres d'optimització populars es donen a continuació:
Nota: la taxa d'aprenentatge és un hiperparàmetre crucial per optimitzar el model, de manera que si hi ha un requisit d'ajustar només un hiperparàmetre, es recomana ajustar la velocitat d'aprenentatge.
Hiperparàmetre per a models específics
Els hiperparàmetres implicats en l'estructura del model es coneixen com a hiperparàmetres per a models específics. Aquestes es donen a continuació:
És important especificar el nombre d'hiperparàmetres d'unitats ocultes per a la xarxa neuronal. Hauria d'estar entre la mida de la capa d'entrada i la mida de la capa de sortida. Més concretament, el nombre d'unitats ocultes hauria de ser 2/3 de la mida de la capa d'entrada, més la mida de la capa de sortida.
Per a funcions complexes, cal especificar el nombre d'unitats ocultes, però no s'ha d'ajustar al model.
Conclusió
Els hiperparàmetres són els paràmetres que es defineixen explícitament per controlar el procés d'aprenentatge abans d'aplicar un algorisme d'aprenentatge automàtic a un conjunt de dades. S'utilitzen per especificar la capacitat d'aprenentatge i la complexitat del model. Alguns dels hiperparàmetres s'utilitzen per a l'optimització dels models, com ara la mida del lot, la taxa d'aprenentatge, etc., i alguns són específics dels models, com el nombre de capes ocultes, etc.