logo

Models d'aprenentatge automàtic

Un model d'aprenentatge automàtic es defineix com una representació matemàtica del resultat del procés d'entrenament. L'aprenentatge automàtic és l'estudi de diferents algorismes que poden millorar automàticament mitjançant l'experiència i dades antigues i construir el model. Un model d'aprenentatge automàtic és similar al programari informàtic dissenyat per reconèixer patrons o comportaments basats en experiències o dades anteriors. L'algoritme d'aprenentatge descobreix patrons dins de les dades d'entrenament i produeix un model de ML que captura aquests patrons i fa prediccions sobre dades noves.

Models d'aprenentatge automàtic

Entendrem un exemple del model ML on estem creant una aplicació per reconèixer les emocions de l'usuari a partir de les expressions facials. Per tant, la creació d'aquesta aplicació és possible mitjançant models d'aprenentatge automàtic on entrenarem un model alimentant imatges de cares amb diverses emocions etiquetades. Sempre que s'utilitza aquesta aplicació per determinar l'estat d'ànim de l'usuari, llegeix totes les dades alimentades i després determina l'estat d'ànim de qualsevol usuari.

Per tant, amb paraules senzilles, podem dir que a El model d'aprenentatge automàtic és una representació simplificada d'alguna cosa o procés. En aquest tema, parlarem de diferents models d'aprenentatge automàtic i les seves tècniques i algorismes .

Què és el model d'aprenentatge automàtic?

Els models d'aprenentatge automàtic es poden entendre com un programa que s'ha entrenat per trobar patrons dins de dades noves i fer prediccions. Aquests models es representen com una funció matemàtica que pren sol·licituds en forma de dades d'entrada, fa prediccions sobre les dades d'entrada i després proporciona una sortida en resposta. En primer lloc, aquests models s'entrenen sobre un conjunt de dades i després se'ls proporciona un algorisme per raonar sobre les dades, extreure el patró de les dades del feed i aprendre d'aquestes dades. Un cop s'entrenen aquests models, es poden utilitzar per predir el conjunt de dades no vist.

Hi ha diversos tipus de models d'aprenentatge automàtic disponibles basats en diferents objectius empresarials i conjunts de dades.

Classificació dels models d'aprenentatge automàtic:

A partir de diferents objectius empresarials i conjunts de dades, hi ha tres models d'aprenentatge per als algorismes. Cada algorisme d'aprenentatge automàtic s'estableix en un dels tres models:

  • Aprenentatge supervisat
  • Aprenentatge no supervisat
  • Aprenentatge de reforç
Models d'aprenentatge automàtic

L'aprenentatge supervisat es divideix a més en dues categories:

  • Classificació
  • Regressió

L'aprenentatge no supervisat també es divideix en les següents categories:

  • Agrupació
  • Reglament de l'Associació
  • Reducció de la dimensionalitat

1. Models d'aprenentatge automàtic supervisat

L'aprenentatge supervisat és el model d'aprenentatge automàtic més senzill per entendre quines dades d'entrada s'anomenen dades d'entrenament i tenen una etiqueta o resultat conegut com a sortida. Per tant, funciona segons el principi de parells entrada-sortida. Requereix crear una funció que es pugui entrenar mitjançant un conjunt de dades d'entrenament, i després s'aplica a dades desconegudes i fa un rendiment predictiu. L'aprenentatge supervisat es basa en tasques i es prova en conjunts de dades etiquetats.

Podem implementar un model d'aprenentatge supervisat sobre problemes senzills de la vida real. Per exemple, tenim un conjunt de dades format per l'edat i l'alçada; llavors, podem construir un model d'aprenentatge supervisat per predir l'alçada de la persona en funció de la seva edat.

Els models d'aprenentatge supervisat es classifiquen a més en dues categories:

Regressió

En problemes de regressió, la sortida és una variable contínua. Alguns models de regressió utilitzats habitualment són els següents:

a) Regressió lineal

La regressió lineal és el model d'aprenentatge automàtic més senzill en què intentem predir una variable de sortida mitjançant una o més variables d'entrada. La representació de la regressió lineal és una equació lineal, que combina un conjunt de valors d'entrada (x) i una sortida prevista (y) per al conjunt d'aquests valors d'entrada. Es representa en forma de línia:

Y = bx + c.

Models d'aprenentatge automàtic

L'objectiu principal del model de regressió lineal és trobar la línia que millor s'ajusti als punts de dades.

La regressió lineal s'estén a la regressió lineal múltiple (trobar un pla de millor ajust) i a la regressió polinòmica (trobar la corba de millor ajust).

b) Arbre de decisió

canyella vs mate

Els arbres de decisió són els models populars d'aprenentatge automàtic que es poden utilitzar tant per a problemes de regressió com de classificació.

Un arbre de decisions utilitza una estructura de decisions semblant a un arbre juntament amb les seves possibles conseqüències i resultats. En això, cada node intern s'utilitza per representar una prova sobre un atribut; cada branca s'utilitza per representar el resultat de la prova. Com més nodes tingui un arbre de decisió, més precís serà el resultat.

L'avantatge dels arbres de decisió és que són intuïtius i fàcils d'implementar, però no tenen precisió.

Els arbres de decisió s'utilitzen àmpliament investigació operativa, concretament en anàlisi de decisions, planificació estratègica , i principalment en aprenentatge automàtic.

c) Bosc aleatori

Random Forest és el mètode d'aprenentatge conjunt, que consta d'un gran nombre d'arbres de decisió. Cada arbre de decisió en un bosc aleatori prediu un resultat, i la predicció amb la majoria de vots es considera com el resultat.

Es pot utilitzar un model de bosc aleatori tant per a problemes de regressió com de classificació.

Per a la tasca de classificació, el resultat del bosc a l'atzar es pren de la majoria de vots. Mentre que a la tasca de regressió, el resultat es pren de la mitjana o mitjana de les prediccions generades per cada arbre.

d) Xarxes neuronals

Les xarxes neuronals són el subconjunt de l'aprenentatge automàtic i també es coneixen com a xarxes neuronals artificials. Les xarxes neuronals estan formades per neurones artificials i estan dissenyades d'una manera que s'assembla a l'estructura i funcionament del cervell humà. Cada neurona artificial es connecta amb moltes altres neurones en una xarxa neuronal, i aquests milions de neurones connectades creen una estructura cognitiva sofisticada.

Models d'aprenentatge automàtic

Les xarxes neuronals consisteixen en una estructura multicapa, que conté una capa d'entrada, una o més capes ocultes i una capa de sortida. A mesura que cada neurona està connectada amb una altra neurona, transfereix dades d'una capa a l'altra neurona de les capes següents. Finalment, les dades arriben a l'última capa o capa de sortida de la xarxa neuronal i generen sortida.

Les xarxes neuronals depenen de les dades d'entrenament per aprendre i millorar-ne la precisió. Tanmateix, una xarxa neuronal perfectament entrenada i precisa pot agrupar dades ràpidament i convertir-se en una potent eina d'aprenentatge automàtic i d'IA. Una de les xarxes neuronals més conegudes és Algorisme de cerca de Google.

Classificació

Els models de classificació són el segon tipus de tècniques d'aprenentatge supervisat, que s'utilitzen per generar conclusions a partir de valors observats en forma categòrica. Per exemple, el model de classificació pot identificar si el correu electrònic és correu brossa o no; un comprador comprarà el producte o no, etc. Els algorismes de classificació s'utilitzen per predir dues classes i categoritzar la sortida en diferents grups.

En la classificació, es dissenya un model de classificador que classifica el conjunt de dades en diferents categories, i a cada categoria se li assigna una etiqueta.

Hi ha dos tipus de classificacions en l'aprenentatge automàtic:

    Classificació binària: Si el problema només té dues classes possibles, s'anomena classificador binari. Per exemple, gat o gos, Sí o No,Classificació multiclasse: Si el problema té més de dues classes possibles, és un classificador multiclasse.

Alguns algorismes de classificació populars són els següents:

a) Regressió logística

La regressió logística s'utilitza per resoldre els problemes de classificació en l'aprenentatge automàtic. Són similars a la regressió lineal però s'utilitzen per predir les variables categòriques. Pot predir la sortida en Sí o No, 0 o 1, Vertader o Fals, etc. No obstant això, en lloc de donar els valors exactes, proporciona els valors probabilístics entre 0 i 1.

b) Màquina vectorial de suport

La màquina vectorial de suport o SVM és el popular algorisme d'aprenentatge automàtic, que s'utilitza àmpliament per a tasques de classificació i regressió. Tanmateix, concretament, s'utilitza per resoldre problemes de classificació. L'objectiu principal de SVM és trobar els millors límits de decisió en un espai N-dimensional, que pot segregar els punts de dades en classes, i el millor límit de decisió es coneix com Hyperplane. SVM selecciona el vector extrem per trobar l'hiperpla, i aquests vectors es coneixen com a vectors de suport.

Models d'aprenentatge automàtic

c) Bayes naïf

Naïve Bayes és un altre algorisme de classificació popular utilitzat en l'aprenentatge automàtic. S'anomena així ja que es basa en el teorema de Bayes i segueix el supòsit ingenu (independent) entre les característiques que es dóna com:

Models d'aprenentatge automàtic

Cada classificador Bayes naïf assumeix que el valor d'una variable específica és independent de qualsevol altra variable/característica. Per exemple, si cal classificar una fruita segons el color, la forma i el gust. Així, groc, ovalat i dolç es reconeixerà com a mango. Aquí cada característica és independent de les altres.

2. Models d'aprenentatge automàtic no supervisats

Els models d'aprenentatge automàtic no supervisat implementen el procés d'aprenentatge contrari a l'aprenentatge supervisat, la qual cosa significa que permet que el model aprengui del conjunt de dades d'entrenament sense etiqueta. A partir del conjunt de dades sense etiquetar, el model prediu la sortida. Utilitzant l'aprenentatge no supervisat, el model aprèn els patrons ocults del conjunt de dades per si mateix sense cap supervisió.

Els models d'aprenentatge no supervisat s'utilitzen principalment per realitzar tres tasques, que són les següents:

    Agrupació
    El clúster és una tècnica d'aprenentatge no supervisat que consisteix a agrupar o palpar els punts de dades en diferents clústers basats en semblances i diferències. Els objectes amb més similituds es mantenen en el mateix grup, i no tenen o molt poques semblances d'altres grups.
    Els algorismes de clúster es poden utilitzar àmpliament en diferents tasques, com ara Segmentació d'imatges, Anàlisi de dades estadístiques, Segmentació de mercat , etc.
    Alguns algorismes de clúster utilitzats habitualment són K-significa Clustering, Clustering jeràrquic, DBSCAN , etc.
    Models d'aprenentatge automàtic Aprenentatge de normes d'associació
    L'aprenentatge de regles d'associació és una tècnica d'aprenentatge no supervisat, que troba relacions interessants entre variables dins d'un gran conjunt de dades. L'objectiu principal d'aquest algorisme d'aprenentatge és trobar la dependència d'un element de dades sobre un altre element de dades i mapejar aquestes variables en conseqüència perquè pugui generar el màxim benefici. Aquest algorisme s'aplica principalment a Anàlisi de cistella de mercat, mineria d'ús web, producció contínua , etc.
    Alguns algorismes populars d'aprenentatge de regles d'associació són Algoritme Apriori, Eclat, algorisme de creixement FP. Reducció de la dimensionalitat
    El nombre de característiques/variables presents en un conjunt de dades es coneix com a dimensionalitat del conjunt de dades, i la tècnica utilitzada per reduir la dimensionalitat es coneix com a tècnica de reducció de la dimensionalitat.
    Tot i que més dades proporcionen resultats més precisos, també pot afectar el rendiment del model/algorisme, com ara problemes d'ajustament excessiu. En aquests casos, s'utilitzen tècniques de reducció de dimensionalitat.
    ' És un procés per convertir el conjunt de dades de dimensions més altes en un conjunt de dades de dimensions menors per assegurar-se que proporcioni informació similar .'
    Diferents mètodes de reducció de dimensionalitat com com PCA (anàlisi de components principals), descomposició de valors singulars, etc.

Aprenentatge de reforç

En l'aprenentatge per reforç, l'algoritme aprèn accions per a un conjunt determinat d'estats que condueixen a un estat objectiu. És un model d'aprenentatge basat en retroalimentació que pren senyals de retroalimentació després de cada estat o acció mitjançant la interacció amb l'entorn. Aquest feedback funciona com una recompensa (positiu per a cada bona acció i negatiu per a cada mala acció), i l'objectiu de l'agent és maximitzar les recompenses positives per millorar el seu rendiment.

El comportament del model en l'aprenentatge per reforç és similar a l'aprenentatge humà, ja que els humans aprenen coses mitjançant experiències com a feedback i interactuen amb l'entorn.

A continuació es mostren alguns algorismes populars que es troben en aprenentatge de reforç:

    Q-learning:Q-learning és un dels algorismes populars d'aprenentatge per reforç sense models, que es basa en l'equació de Bellman.

Té com a objectiu conèixer la política que pot ajudar l'agent d'IA a prendre la millor acció per maximitzar la recompensa en una circumstància específica. Incorpora valors Q per a cada parella estat-acció que indiquen la recompensa per seguir un camí d'estat donat i intenta maximitzar el valor Q.

    Acció-Estat-Recompensa-Acció-Estat (SARSA):SARSA és un algorisme on-policy basat en el procés de decisió de Markov. Utilitza l'acció realitzada per la política actual per conèixer el valor Q. L'algoritme SARSA es manté per a l'acció estatal Recompensa l'acció estatal, que simbolitza la tupla (s, a, r, s', a'). Xarxa Deep Q:DQN o Deep Q La xarxa neuronal és Q-learning dins de la xarxa neuronal. Bàsicament s'utilitza en un entorn d'espai d'estat gran on definir una taula Q seria una tasca complexa. Per tant, en aquest cas, en lloc d'utilitzar la taula Q, la xarxa neuronal utilitza valors Q per a cada acció en funció de l'estat.

Formació de models d'aprenentatge automàtic

Un cop construït el model d'aprenentatge automàtic, s'entrena per obtenir els resultats adequats. Per entrenar un model d'aprenentatge automàtic, cal una gran quantitat de dades preprocessades. Aquí les dades preprocessades significa dades en forma estructurada amb valors nuls reduïts, etc. Si no proporcionem dades preprocessades, hi ha grans possibilitats que el nostre model tingui un rendiment terrible.

Com triar el millor model?

A la secció anterior, hem parlat de diferents models i algorismes d'aprenentatge automàtic. Però una pregunta més confusa que pot sorgir a qualsevol principiant és 'quin model he de triar?'. Per tant, la resposta és que depèn principalment del requisit empresarial o del projecte. A part d'això, també depèn dels atributs associats, del volum del conjunt de dades disponible, del nombre de característiques, de la complexitat, etc. No obstant això, a la pràctica, es recomana començar sempre pel model més senzill que es pugui aplicar a la situació concreta. problema i, a continuació, millorar gradualment la complexitat i provar la precisió amb l'ajuda de l'ajust de paràmetres i la validació creuada.

Diferència entre el model d'aprenentatge automàtic i els algorismes

Una de les preguntes més confuses entre els principiants és que són els models d'aprenentatge automàtic i els algorismes són els mateixos? Perquè en diversos casos en aprenentatge automàtic i ciència de dades, aquests dos termes s'utilitzen indistintament.

La resposta a aquesta pregunta és No, i el model d'aprenentatge automàtic no és el mateix que un algorisme. D'una manera senzilla, an L'algorisme ML és com un procediment o mètode que s'executa amb dades per descobrir-ne patrons i generar el model. Al mateix temps, a El model d'aprenentatge automàtic és com un programa informàtic que genera resultats o fa prediccions . Més concretament, quan entrenem un algorisme amb dades, es converteix en un model.

 Machine Learning Model = Model Data + Prediction Algorithm