logo

Aprenentatge supervisat i no supervisat

L'aprenentatge automàtic és un camp de la informàtica que dóna als ordinadors la capacitat d'aprendre sense ser programats explícitament. L'aprenentatge supervisat i l'aprenentatge no supervisat són dos tipus principals d'aprenentatge aprenentatge automàtic .

En aprenentatge supervisat , la màquina s'entrena en un conjunt de dades etiquetades, el que significa que les dades d'entrada s'aparellen amb la sortida desitjada. Aleshores, la màquina aprèn a predir la sortida de noves dades d'entrada. L'aprenentatge supervisat s'utilitza sovint per a tasques com la classificació, la regressió i la detecció d'objectes.

En l'aprenentatge no supervisat, la màquina s'entrena en un conjunt de dades sense etiquetar, la qual cosa significa que les dades d'entrada no estan emparellades amb la sortida desitjada. Aleshores, la màquina aprèn a trobar patrons i relacions a les dades. L'aprenentatge no supervisat s'utilitza sovint per a tasques com ara agrupació , reducció de dimensionalitat i detecció d'anomalies.



Què és l'aprenentatge supervisat?

L'aprenentatge supervisat és un tipus de algorisme d'aprenentatge automàtic que aprèn de les dades etiquetades. Les dades etiquetades són dades que s'han etiquetat amb una resposta o classificació correcta.

L'aprenentatge supervisat, com el seu nom indica, compta amb la presència d'un supervisor com a professor. L'aprenentatge supervisat és quan ensenyem o entrenem la màquina utilitzant dades que estan ben etiquetades. El que significa que algunes dades ja estan etiquetades amb la resposta correcta. Després d'això, la màquina disposa d'un nou conjunt d'exemples (dades) de manera que l'algoritme d'aprenentatge supervisat analitza les dades d'entrenament (conjunt d'exemples d'entrenament) i produeix un resultat correcte a partir de les dades etiquetades.

Per exemple, un conjunt de dades etiquetat d'imatges d'elefant, camell i vaca tindria cada imatge etiquetada amb Elephant , Camelor Cow.

Aprenentatge-supervisat

Punts clau:

  • L'aprenentatge supervisat implica entrenar una màquina a partir de dades etiquetades.
  • Les dades etiquetades consten d'exemples amb la resposta o classificació correcta.
  • La màquina aprèn la relació entre les entrades (imatges de fruites) i les sortides (etiquetes de fruites).
  • Llavors, la màquina entrenada pot fer prediccions sobre dades noves sense etiquetar.

Exemple:

Suposem que teniu una cistella de fruites que voleu identificar. La màquina analitzaria primer la imatge per extreure característiques com la seva forma, color i textura. Aleshores, compararia aquestes característiques amb les característiques dels fruits que ja ha après. Si les característiques de la nova imatge són més semblants a les d'una poma, la màquina prediria que la fruita és una poma.

ordre per sql aleatori

Per exemple , suposem que et donen una cistella plena de diferents tipus de fruites. Ara el primer pas és entrenar la màquina amb totes les diferents fruites una per una així:

  • Si la forma de l'objecte és arrodonida i té una depressió a la part superior, és de color vermell, llavors s'etiquetarà com - poma .
  • Si la forma de l'objecte és un cilindre llarg i corbat de color verd-groc, s'etiquetarà com a: Plàtan .

Ara suposem que després d'entrenar les dades, heu donat una nova fruita separada, digues plàtan de la cistella, i has demanat identificar-la.

Atès que la màquina ja ha après les coses de dades anteriors i aquesta vegada s'ha d'utilitzar amb prudència. Primer classificarà la fruita amb la seva forma i color i confirmaria el nom de la fruita com a PLÀTAN i la posaria a la categoria Plàtan. Així, la màquina aprèn les coses de les dades d'entrenament (cistella que conté fruites) i després aplica el coneixement per provar les dades (fruita nova).

Tipus d'aprenentatge supervisat

L'aprenentatge supervisat es classifica en dues categories d'algorismes:

  • Regressió : Un problema de regressió és quan la variable de sortida és un valor real, com ara dòlars o pes.
  • Classificació : Un problema de classificació és quan la variable de sortida és una categoria, com ara vermell o blau , malaltia o cap malaltia.

L'aprenentatge supervisat tracta o aprèn amb dades etiquetades. Això implica que algunes dades ja estan etiquetades amb la resposta correcta.

1- Regressió

La regressió és un tipus d'aprenentatge supervisat que s'utilitza per predir valors continus, com ara els preus de l'habitatge, els preus de les accions o la pèrdua de clients. Els algorismes de regressió aprenen una funció que mapeja des de les característiques d'entrada al valor de sortida.

com trobar la mida del monitor

Alguns comuns algorismes de regressió incloure:

  • Regressió lineal
  • Regressió polinòmica
  • Suport a la regressió de màquina vectorial
  • Regression de l'arbre de decisions
  • Regression forestal aleatòria

2- Classificació

La classificació és un tipus d'aprenentatge supervisat que s'utilitza per predir valors categòrics, com ara si un client abandonarà o no, si un correu electrònic és correu brossa o no, o si una imatge mèdica mostra un tumor o no. Els algorismes de classificació aprenen una funció que mapeja des de les característiques d'entrada a una distribució de probabilitat sobre les classes de sortida.

Alguns comuns algorismes de classificació incloure:

  • Regressió logística
  • Suport a les màquines vectorials
  • Arbres de decisió
  • Boscos aleatoris
  • Baye ingenu

Avaluació de models d'aprenentatge supervisat

L'avaluació dels models d'aprenentatge supervisat és un pas important per garantir que el model sigui precís i generalitzable. N'hi ha una sèrie de diferents mètriques que es poden utilitzar per avaluar models d'aprenentatge supervisat, però alguns dels més comuns inclouen:

Per a la regressió

  • Error quadrat mitjà (MSE): MSE mesura la diferència quadrada mitjana entre els valors predits i els valors reals. Els valors de MSE més baixos indiquen un millor rendiment del model.
  • Error quadrat mitjà arrel (RMSE): RMSE és l'arrel quadrada de MSE, que representa la desviació estàndard dels errors de predicció. De manera similar a MSE, els valors RMSE més baixos indiquen un millor rendiment del model.
  • Error mitjà absolut (MAE): MAE mesura la diferència absoluta mitjana entre els valors predits i els valors reals. És menys sensible als valors atípics en comparació amb MSE o RMSE.
  • R-quadrat (coeficient de determinació): R-quadrat mesura la proporció de la variància en la variable objectiu que s'explica pel model. Els valors de R quadrat més alts indiquen un millor ajust del model.

Per a la Classificació

  • Precisió: La precisió és el percentatge de prediccions que el model fa correctament. Es calcula dividint el nombre de prediccions correctes pel nombre total de prediccions.
  • Precisió: La precisió és el percentatge de prediccions positives que fa el model que són realment correctes. Es calcula dividint el nombre de veritables positius pel nombre total de prediccions positives.
  • Recorda: El record és el percentatge de tots els exemples positius que el model identifica correctament. Es calcula dividint el nombre de veritables positius pel nombre total d'exemples positius.
  • Puntuació F1: La puntuació F1 és una mitjana ponderada de precisió i record. Es calcula prenent la mitjana harmònica de precisió i record.
  • Matriu de confusió: Una matriu de confusió és una taula que mostra el nombre de prediccions per a cada classe, juntament amb les etiquetes de classe reals. Es pot utilitzar per visualitzar el rendiment del model i identificar àrees on el model està lluitant.

Aplicacions de l'aprenentatge supervisat

L'aprenentatge supervisat es pot utilitzar per resoldre una gran varietat de problemes, com ara:

  • Filtre de correu brossa: Els algorismes d'aprenentatge supervisat es poden entrenar per identificar i classificar correus electrònics de correu brossa en funció del seu contingut, ajudant els usuaris a evitar missatges no desitjats.
  • Classificació de la imatge: L'aprenentatge supervisat pot classificar automàticament les imatges en diferents categories, com ara animals, objectes o escenes, facilitant tasques com la cerca d'imatges, la moderació de contingut i les recomanacions de productes basades en imatges.
  • Diagnòstic mèdic: L'aprenentatge supervisat pot ajudar en el diagnòstic mèdic mitjançant l'anàlisi de les dades del pacient, com ara imatges mèdiques, resultats de proves i historial del pacient, per identificar patrons que suggereixen malalties o condicions específiques.
  • Detecció de frau: Els models d'aprenentatge supervisat poden analitzar transaccions financeres i identificar patrons que indiquen activitat fraudulenta, ajudant les institucions financeres a prevenir el frau i protegir els seus clients.
  • Processament del llenguatge natural (PNL): L'aprenentatge supervisat té un paper crucial en les tasques de PNL, com ara l'anàlisi de sentiments, la traducció automàtica i el resum de text, permetent que les màquines entenguin i processin el llenguatge humà de manera eficaç.

Avantatges de l'aprenentatge supervisat

  • L'aprenentatge supervisat permet recollir dades i generar dades d'experiències anteriors.
  • Ajuda a optimitzar els criteris de rendiment amb l'ajuda de l'experiència.
  • L'aprenentatge automàtic supervisat ajuda a resoldre diversos tipus de problemes de càlcul del món real.
  • Realitza tasques de classificació i regressió.
  • Permet estimar o mapejar el resultat a una nova mostra.
  • Tenim un control total sobre l'elecció del nombre de classes que volem a les dades de formació.

Inconvenients de l'aprenentatge supervisat

  • Classificar el big data pot ser un repte.
  • La formació per a l'aprenentatge supervisat requereix molt de temps de càlcul. Per tant, requereix molt de temps.
  • L'aprenentatge supervisat no pot gestionar totes les tasques complexes de l'aprenentatge automàtic.
  • El temps de càlcul és gran per a l'aprenentatge supervisat.
  • Requereix un conjunt de dades etiquetat.
  • Requereix un procés de formació.

Què és l'aprenentatge no supervisat?

L'aprenentatge no supervisat és un tipus d'aprenentatge automàtic que aprèn a partir de dades sense etiquetar. Això vol dir que les dades no tenen cap etiqueta o categoria preexistent. L'objectiu de l'aprenentatge no supervisat és descobrir patrons i relacions a les dades sense cap guia explícita.

L'aprenentatge no supervisat és l'entrenament d'una màquina que utilitza informació que no està classificada ni etiquetada i permet que l'algorisme actuï sobre aquesta informació sense orientació. Aquí la tasca de la màquina és agrupar la informació no ordenada segons semblances, patrons i diferències sense cap formació prèvia de dades.

A diferència de l'aprenentatge supervisat, no es proporciona cap professor, la qual cosa significa que no es donarà formació a la màquina. Per tant, la màquina està restringida a trobar l'estructura oculta en dades sense etiquetar per si mateixa.

Podeu utilitzar l'aprenentatge no supervisat per examinar les dades dels animals que s'han recopilat i distingir entre diversos grups segons els trets i les accions dels animals. Aquestes agrupacions poden correspondre a diverses espècies animals, la qual cosa us permet classificar les criatures sense dependre de les etiquetes que ja existeixen.

Aprenentatge no supervisat

Punts clau

compara amb les cadenes de java
  • L'aprenentatge no supervisat permet al model descobrir patrons i relacions en dades sense etiquetar.
  • Els algorismes d'agrupament agrupen punts de dades similars en funció de les seves característiques inherents.
  • L'extracció de característiques captura informació essencial de les dades, cosa que permet al model fer distincions significatives.
  • L'associació d'etiquetes assigna categories als clústers en funció dels patrons i característiques extrets.

Exemple

Imagineu que teniu un model d'aprenentatge automàtic entrenat en un gran conjunt de dades d'imatges sense etiquetar, que conté gossos i gats. La model no ha vist mai abans una imatge d'un gos o gat, i no té etiquetes o categories preexistents per a aquests animals. La vostra tasca és utilitzar l'aprenentatge no supervisat per identificar els gossos i els gats en una imatge nova i invisible.

Per exemple , suposem que se li dóna una imatge amb gossos i gats que no ha vist mai.

Per tant, la màquina no té ni idea de les característiques dels gossos i gats, de manera que no podem classificar-la com a 'gossos i gats'. Però pot classificar-los segons les seves semblances, patrons i diferències, és a dir, podem categoritzar fàcilment la imatge anterior en dues parts. El primer pot contenir totes les fotos que tinguin gossos en ells i la segona part pot contenir totes les fotos que tinguin gats en ells. Aquí no heu après res abans, el que significa que no hi ha dades d'entrenament ni exemples.

Permet que el model funcioni per si mateix per descobrir patrons i informació que abans no es detectava. S'ocupa principalment de dades sense etiquetar.

Tipus d'aprenentatge no supervisat

L'aprenentatge no supervisat es classifica en dues categories d'algorismes:

  • Agrupació : un problema d'agrupació és quan voleu descobrir les agrupacions inherents a les dades, com ara l'agrupació de clients per comportament de compra.
  • Associació : un problema d'aprenentatge de regles d'associació és quan voleu descobrir regles que descriuen grans porcions de les vostres dades, com ara les persones que compren X també tendeixen a comprar Y.

Agrupació

El clúster és un tipus d'aprenentatge no supervisat que s'utilitza per agrupar punts de dades similars. Algoritmes de agrupació treballen movent iterativament els punts de dades més a prop dels seus centres de clúster i més lluny dels punts de dades d'altres clústers.

  1. Exclusiu (particionament)
  2. Aglomeratiu
  3. Superposició
  4. Probabilística

Tipus de agrupació: -

  1. Agrupació jeràrquica
  2. K-significa agrupació
  3. Anàlisi de components principals
  4. Descomposició de valors singulars
  5. Anàlisi independent de components
  6. Models de mescles gaussianes (GMM)
  7. Agrupació espacial d'aplicacions amb soroll basada en densitat (DBSCAN)

Aprenentatge de regles d'associació

L'aprenentatge de regles d'associació és un tipus d'aprenentatge no supervisat que s'utilitza per identificar patrons en les dades. Reglament d'associació Els algorismes d'aprenentatge funcionen trobant relacions entre diferents elements d'un conjunt de dades.

Alguns algorismes comuns d'aprenentatge de regles d'associació inclouen:

  • Algorisme a priori
  • Algoritme Eclat
  • FP-Algoritme de creixement

Avaluació de models d'aprenentatge no supervisat

L'avaluació dels models d'aprenentatge no supervisat és un pas important per garantir que el model sigui eficaç i útil. Tanmateix, pot ser més difícil que avaluar els models d'aprenentatge supervisat, ja que no hi ha dades de veritat sobre el terreny per comparar les prediccions del model.

Hi ha una sèrie de mètriques diferents que es poden utilitzar per avaluar models d'aprenentatge no supervisat, però algunes de les més habituals inclouen:

  • Puntuació de la silueta: La puntuació de la silueta mesura com de bé s'agrupa cada punt de dades amb els seus propis membres de clúster i se separa d'altres clústers. Oscil·la entre -1 i 1, amb puntuacions més altes que indiquen una millor agrupació.
  • Puntuació Calinski-Harabasz: La puntuació de Calinski-Harabasz mesura la proporció entre la variància entre clústers i la variància dins dels clústers. Va de 0 a infinit, amb puntuacions més altes que indiquen una millor agrupació.
  • Índex Rand ajustat: L'índex Rand ajustat mesura la similitud entre dues agrupacions. Oscil·la entre -1 i 1, amb puntuacions més altes que indiquen agrupacions més similars.
  • Índex de Davies-Buldin: L'índex de Davies-Bouldin mesura la similitud mitjana entre clústers. Va de 0 a infinit, amb puntuacions més baixes que indiquen una millor agrupació.
  • Puntuació F1: La puntuació F1 és una mitjana ponderada de precisió i record, que són dues mètriques que s'utilitzen habitualment en l'aprenentatge supervisat per avaluar els models de classificació. Tanmateix, la puntuació F1 també es pot utilitzar per avaluar models d'aprenentatge no supervisats, com ara els models de clustering.

Aplicació d'aprenentatge no supervisat

L'aprenentatge no supervisat es pot utilitzar per resoldre una gran varietat de problemes, com ara:

  • Detecció d'anomalies: l'aprenentatge no supervisat pot identificar patrons inusuals o desviacions del comportament normal de les dades, permetent la detecció de fraus, intrusions o fallades del sistema.
  • Descobriment científic: l'aprenentatge no supervisat pot descobrir relacions i patrons ocults en dades científiques, donant lloc a noves hipòtesis i coneixements en diversos camps científics.
  • Sistemes de recomanació: l'aprenentatge no supervisat pot identificar patrons i similituds en el comportament i les preferències dels usuaris per recomanar productes, pel·lícules o música que s'alineen amb els seus interessos.
  • Segmentació de clients: l'aprenentatge no supervisat pot identificar grups de clients amb característiques similars, permetent a les empreses orientar campanyes de màrqueting i millorar el servei al client de manera més eficaç.
  • Anàlisi d'imatges: l'aprenentatge no supervisat pot agrupar imatges en funció del seu contingut, facilitant tasques com la classificació d'imatges, la detecció d'objectes i la recuperació d'imatges.

Avantatges d'aprenentatge no supervisat

  • No requereix que les dades d'entrenament estiguin etiquetades.
  • La reducció de la dimensionalitat es pot aconseguir fàcilment mitjançant l'aprenentatge no supervisat.
  • Capaç de trobar patrons desconeguts anteriorment a les dades.
  • L'aprenentatge no supervisat us pot ajudar a obtenir informació a partir de dades sense etiquetar que potser no hauríeu pogut obtenir d'una altra manera.
  • L'aprenentatge no supervisat és bo per trobar patrons i relacions a les dades sense que se li indiqui què cal buscar. Això us pot ajudar a aprendre coses noves sobre les vostres dades.

Desavantatges d'aprenentatge no supervisat

  • Difícil de mesurar la precisió o l'efectivitat a causa de la manca de respostes predefinides durant l'entrenament.
  • Els resultats sovint tenen menys precisió.
  • L'usuari ha de dedicar temps a interpretar i etiquetar les classes que segueixen aquesta classificació.
  • L'aprenentatge no supervisat pot ser sensible a la qualitat de les dades, inclosos els valors que falten, els valors atípics i les dades sorolloses.
  • Sense dades etiquetades, pot ser difícil avaluar el rendiment dels models d'aprenentatge no supervisats, cosa que dificulta avaluar-ne l'eficàcia.

Aprenentatge automàtic supervisat vs. no supervisat

Paràmetres Aprenentatge automàtic supervisat Aprenentatge automàtic no supervisat
Dades d'entrada Els algorismes s'entrenen mitjançant dades etiquetades. Els algorismes s'utilitzen contra dades que no estan etiquetades
Complexitat computacional Mètode més senzill Computacionalment complexa
Precisió Altament precís Menys precís
Nº de classes Es coneix el nombre de classes No es coneix el nombre de classes
Anàlisi de dades Utilitza anàlisi fora de línia Utilitza l'anàlisi de dades en temps real
Algorismes utilitzats

Regresió lineal i logística, bosc aleatori, classificació multiclasse, arbre de decisió, màquina vectorial de suport, xarxa neuronal, etc.

botó al centre css

Clúster de K-Means, Clúster jeràrquic, KNN, algorisme a priori, etc.

Sortida Es dóna la sortida desitjada. No es dóna la sortida desitjada.
Dades de formació Utilitzeu dades d'entrenament per inferir el model. No s'utilitzen dades d'entrenament.
Model complex No és possible aprendre models més grans i complexos que amb l'aprenentatge supervisat. És possible aprendre models més grans i complexos amb un aprenentatge no supervisat.
Model Podem provar el nostre model. No podem provar el nostre model.
Anomenat com L'aprenentatge supervisat també s'anomena classificació. L'aprenentatge no supervisat també s'anomena agrupació.
Exemple Exemple: reconeixement òptic de caràcters. Exemple: trobar una cara en una imatge.

Supervisió

germans kylie jenner

l'aprenentatge supervisat necessita supervisió per entrenar el model.

L'aprenentatge no supervisat no necessita cap supervisió per entrenar el model.

Conclusió

L'aprenentatge supervisat i no supervisat són dues eines poderoses que es poden utilitzar per resoldre una gran varietat de problemes. L'aprenentatge supervisat és adequat per a tasques on es coneix el resultat desitjat, mentre que l'aprenentatge no supervisat és adequat per a tasques on es desconeix el resultat desitjat.

Preguntes freqüents (FAQ)

1. Quina diferència hi ha entre el llenguatge de màquina supervisat i no supervisat?

L'aprenentatge supervisat i no supervisat són dos enfocaments fonamentals de l'aprenentatge automàtic que es diferencien en les seves dades d'entrenament i objectius d'aprenentatge.

  • Aprenentatge supervisat implica entrenar un model d'aprenentatge automàtic en un conjunt de dades etiquetat, on cada punt de dades té una etiqueta o valor de sortida corresponent. L'algoritme aprèn a mapar les dades d'entrada a la sortida desitjada, el que li permet fer prediccions per a dades noves i no vistes.
  • Aprenentatge no supervisat , en canvi, tracta de conjunts de dades sense etiquetar, on els punts de dades no tenen etiquetes associades ni valors de sortida.

2. Què és l'aprenentatge supervisat?

L'aprenentatge supervisat és un tipus d'aprenentatge automàtic on l'algorisme s'entrena en un conjunt de dades etiquetat, on cada punt de dades té una etiqueta o valor de sortida corresponent. L'algoritme aprèn a mapar les dades d'entrada a la sortida desitjada, el que li permet fer prediccions per a dades noves i no vistes.

3. Quins són els algorismes comuns d'aprenentatge supervisat?

Els algorismes comuns d'aprenentatge supervisat inclouen:

  • Classificació: S'utilitza per assignar categories als punts de dades. Alguns exemples inclouen màquines vectorials de suport (SVM), regressió logística i arbres de decisió.
  • Regressió: S'utilitza per predir valors numèrics continus. Els exemples inclouen la regressió lineal, la regressió polinòmica i la regressió de cresta.

4. Quins són els algorismes comuns d'aprenentatge no supervisat?

Els algorismes comuns d'aprenentatge no supervisat inclouen:

  • Agrupació: Agrupació de punts de dades en clústers en funció de la seva similitud. Els exemples inclouen l'agrupació k-means i la agrupació jeràrquica.
  • Reducció de la dimensionalitat: Reduir el nombre de funcions d'un conjunt de dades alhora que es conserva la informació més important. Alguns exemples inclouen l'anàlisi de components principals (PCA) i els codificadors automàtics.

5. Què és l'aprenentatge no supervisat?

L'aprenentatge no supervisat és un tipus d'aprenentatge automàtic on l'algorisme s'entrena en un conjunt de dades sense etiquetar, on els punts de dades no tenen etiquetes ni valors de sortida corresponents. L'algoritme aprèn a identificar patrons i estructures a les dades sense una guia explícita.

6. Quan utilitzar l'aprenentatge supervisat versus l'aprenentatge no supervisat?

Utilitzeu l'aprenentatge supervisat quan teniu un conjunt de dades etiquetat i voleu fer prediccions per a dades noves. Utilitzeu l'aprenentatge no supervisat quan teniu un conjunt de dades sense etiquetar i voleu identificar patrons o estructures a les dades.