Al tema anterior, vam aprendre aprenentatge automàtic supervisat en què els models s'entrenen mitjançant dades etiquetades sota la supervisió de dades d'entrenament. Però pot haver-hi molts casos en què no tinguem dades etiquetades i necessitem trobar els patrons ocults del conjunt de dades donat. Per tant, per resoldre aquest tipus de casos en l'aprenentatge automàtic, necessitem tècniques d'aprenentatge no supervisat.
Què és l'aprenentatge no supervisat?
Com el seu nom indica, l'aprenentatge no supervisat és una tècnica d'aprenentatge automàtic en què els models no es supervisen mitjançant un conjunt de dades d'entrenament. En canvi, els mateixos models troben els patrons ocults i les idees de les dades proporcionades. Es pot comparar amb l'aprenentatge que té lloc al cervell humà mentre s'aprèn coses noves. Es pot definir com:
com canviar el nom d'un directori linux
L'aprenentatge no supervisat és un tipus d'aprenentatge automàtic en què els models s'entrenen amb un conjunt de dades sense etiqueta i se'ls permet actuar sobre aquestes dades sense cap supervisió.
L'aprenentatge no supervisat no es pot aplicar directament a un problema de regressió o classificació perquè, a diferència de l'aprenentatge supervisat, tenim les dades d'entrada però no les dades de sortida corresponents. L'objectiu de l'aprenentatge no supervisat és Trobeu l'estructura subjacent del conjunt de dades, agrupeu-les segons les similituds i representeu aquest conjunt de dades en un format comprimit .
Exemple: Suposem que l'algorisme d'aprenentatge no supervisat rep un conjunt de dades d'entrada que conté imatges de diferents tipus de gats i gossos. L'algorisme mai s'entrena sobre el conjunt de dades donat, el que significa que no té cap idea de les característiques del conjunt de dades. La tasca de l'algoritme d'aprenentatge no supervisat és identificar les característiques de la imatge per si mateixes. L'algorisme d'aprenentatge no supervisat realitzarà aquesta tasca agrupant el conjunt de dades d'imatges en grups segons les similituds entre les imatges.
Per què utilitzar l'aprenentatge no supervisat?
A continuació es mostren alguns dels motius principals que descriuen la importància de l'aprenentatge no supervisat:
- L'aprenentatge no supervisat és útil per trobar informació útil a partir de les dades.
- L'aprenentatge no supervisat és molt semblant a com un humà aprèn a pensar per les seves pròpies experiències, cosa que l'apropa a la IA real.
- L'aprenentatge no supervisat funciona amb dades no etiquetades i no categoritzades, cosa que fa que l'aprenentatge no supervisat sigui més important.
- En el món real, no sempre disposem de dades d'entrada amb la sortida corresponent, de manera que per resoldre aquests casos, necessitem un aprenentatge no supervisat.
Treball de l'aprenentatge no supervisat
El funcionament de l'aprenentatge no supervisat es pot entendre amb el diagrama següent:
Aquí, hem pres una dada d'entrada sense etiqueta, el que significa que no està categoritzada i tampoc es donen les sortides corresponents. Ara, aquestes dades d'entrada sense etiqueta s'alimenten al model d'aprenentatge automàtic per entrenar-lo. En primer lloc, interpretarà les dades en brut per trobar els patrons ocults de les dades i després aplicarà algorismes adequats com ara agrupació de k-means, arbre de decisions, etc.
Un cop aplica l'algorisme adequat, l'algoritme divideix els objectes de dades en grups segons les similituds i la diferència entre els objectes.
Tipus d'algorisme d'aprenentatge no supervisat:
L'algorisme d'aprenentatge no supervisat es pot classificar en dos tipus de problemes:
Nota: Aprendrem aquests algorismes en capítols posteriors.
Algorismes d'aprenentatge no supervisat:
A continuació es mostra la llista d'alguns algorismes populars d'aprenentatge no supervisat:
cadenes a nombres enters
Avantatges de l'aprenentatge no supervisat
- L'aprenentatge no supervisat s'utilitza per a tasques més complexes en comparació amb l'aprenentatge supervisat perquè, en l'aprenentatge no supervisat, no tenim dades d'entrada etiquetades.
- L'aprenentatge no supervisat és preferible, ja que és fàcil obtenir dades sense etiquetar en comparació amb les dades etiquetades.
Inconvenients de l'aprenentatge no supervisat
- L'aprenentatge no supervisat és intrínsecament més difícil que l'aprenentatge supervisat, ja que no té el resultat corresponent.
- El resultat de l'algorisme d'aprenentatge no supervisat pot ser menys precís, ja que les dades d'entrada no estan etiquetades i els algorismes no coneixen la sortida exacta per endavant.