logo

Aprenentatge automàtic no supervisat

Al tema anterior, vam aprendre aprenentatge automàtic supervisat en què els models s'entrenen mitjançant dades etiquetades sota la supervisió de dades d'entrenament. Però pot haver-hi molts casos en què no tinguem dades etiquetades i necessitem trobar els patrons ocults del conjunt de dades donat. Per tant, per resoldre aquest tipus de casos en l'aprenentatge automàtic, necessitem tècniques d'aprenentatge no supervisat.

Què és l'aprenentatge no supervisat?

Com el seu nom indica, l'aprenentatge no supervisat és una tècnica d'aprenentatge automàtic en què els models no es supervisen mitjançant un conjunt de dades d'entrenament. En canvi, els mateixos models troben els patrons ocults i les idees de les dades proporcionades. Es pot comparar amb l'aprenentatge que té lloc al cervell humà mentre s'aprèn coses noves. Es pot definir com:

com canviar el nom d'un directori linux
L'aprenentatge no supervisat és un tipus d'aprenentatge automàtic en què els models s'entrenen amb un conjunt de dades sense etiqueta i se'ls permet actuar sobre aquestes dades sense cap supervisió.

L'aprenentatge no supervisat no es pot aplicar directament a un problema de regressió o classificació perquè, a diferència de l'aprenentatge supervisat, tenim les dades d'entrada però no les dades de sortida corresponents. L'objectiu de l'aprenentatge no supervisat és Trobeu l'estructura subjacent del conjunt de dades, agrupeu-les segons les similituds i representeu aquest conjunt de dades en un format comprimit .

Exemple: Suposem que l'algorisme d'aprenentatge no supervisat rep un conjunt de dades d'entrada que conté imatges de diferents tipus de gats i gossos. L'algorisme mai s'entrena sobre el conjunt de dades donat, el que significa que no té cap idea de les característiques del conjunt de dades. La tasca de l'algoritme d'aprenentatge no supervisat és identificar les característiques de la imatge per si mateixes. L'algorisme d'aprenentatge no supervisat realitzarà aquesta tasca agrupant el conjunt de dades d'imatges en grups segons les similituds entre les imatges.

Aprenentatge automàtic supervisat

Per què utilitzar l'aprenentatge no supervisat?

A continuació es mostren alguns dels motius principals que descriuen la importància de l'aprenentatge no supervisat:

  • L'aprenentatge no supervisat és útil per trobar informació útil a partir de les dades.
  • L'aprenentatge no supervisat és molt semblant a com un humà aprèn a pensar per les seves pròpies experiències, cosa que l'apropa a la IA real.
  • L'aprenentatge no supervisat funciona amb dades no etiquetades i no categoritzades, cosa que fa que l'aprenentatge no supervisat sigui més important.
  • En el món real, no sempre disposem de dades d'entrada amb la sortida corresponent, de manera que per resoldre aquests casos, necessitem un aprenentatge no supervisat.

Treball de l'aprenentatge no supervisat

El funcionament de l'aprenentatge no supervisat es pot entendre amb el diagrama següent:

Aprenentatge automàtic supervisat

Aquí, hem pres una dada d'entrada sense etiqueta, el que significa que no està categoritzada i tampoc es donen les sortides corresponents. Ara, aquestes dades d'entrada sense etiqueta s'alimenten al model d'aprenentatge automàtic per entrenar-lo. En primer lloc, interpretarà les dades en brut per trobar els patrons ocults de les dades i després aplicarà algorismes adequats com ara agrupació de k-means, arbre de decisions, etc.

Un cop aplica l'algorisme adequat, l'algoritme divideix els objectes de dades en grups segons les similituds i la diferència entre els objectes.

Tipus d'algorisme d'aprenentatge no supervisat:

L'algorisme d'aprenentatge no supervisat es pot classificar en dos tipus de problemes:

Aprenentatge automàtic supervisat
    Agrupació: L'agrupament és un mètode per agrupar els objectes en grups de manera que els objectes amb més similituds es mantinguin en un grup i tinguin menys o cap semblança amb els objectes d'un altre grup. L'anàlisi de clúster troba els punts en comú entre els objectes de dades i els classifica segons la presència i l'absència d'aquests punts en comú.Associació: Una regla d'associació és un mètode d'aprenentatge no supervisat que s'utilitza per trobar les relacions entre variables a la gran base de dades. Determina el conjunt d'elements que es troben junts al conjunt de dades. La regla d'associació fa que l'estratègia de màrqueting sigui més efectiva. Com ara les persones que compren X articles (suposem que un pa) també solen comprar Y (mantega/melmelada). Un exemple típic de regla d'associació és l'anàlisi de cistella de mercat.

Nota: Aprendrem aquests algorismes en capítols posteriors.

Algorismes d'aprenentatge no supervisat:

A continuació es mostra la llista d'alguns algorismes populars d'aprenentatge no supervisat:

cadenes a nombres enters
    K-significa agrupació KNN (k-veïns més propers) Agrupació jeràrquica Detecció d'anomalies Xarxes neuronals Anàlisi de components bàsics Anàlisi independent de components Algorisme a priori Descomposició de valors singulars

Avantatges de l'aprenentatge no supervisat

  • L'aprenentatge no supervisat s'utilitza per a tasques més complexes en comparació amb l'aprenentatge supervisat perquè, en l'aprenentatge no supervisat, no tenim dades d'entrada etiquetades.
  • L'aprenentatge no supervisat és preferible, ja que és fàcil obtenir dades sense etiquetar en comparació amb les dades etiquetades.

Inconvenients de l'aprenentatge no supervisat

  • L'aprenentatge no supervisat és intrínsecament més difícil que l'aprenentatge supervisat, ja que no té el resultat corresponent.
  • El resultat de l'algorisme d'aprenentatge no supervisat pot ser menys precís, ja que les dades d'entrada no estan etiquetades i els algorismes no coneixen la sortida exacta per endavant.