logo

Tipus d'aprenentatge automàtic

L'aprenentatge automàtic és un subconjunt d'IA, que permet a la màquina aprendre automàticament de les dades, millorar el rendiment de les experiències passades i fer prediccions. . L'aprenentatge automàtic conté un conjunt d'algorismes que funcionen amb una gran quantitat de dades. Les dades s'alimenten a aquests algorismes per entrenar-los i, a partir de la formació, construeixen el model i realitzen una tasca específica.

Tipus d'aprenentatge automàtic

Aquests algorismes de ML ajuden a resoldre diferents problemes empresarials com ara regressió, classificació, previsió, agrupació i associacions, etc.

Segons els mètodes i la forma d'aprenentatge, l'aprenentatge automàtic es divideix principalment en quatre tipus, que són:

  1. Aprenentatge automàtic supervisat
  2. Aprenentatge automàtic no supervisat
  3. Aprenentatge automàtic semi-supervisat
  4. Aprenentatge de reforç
Tipus d'aprenentatge automàtic

En aquest tema, oferirem una descripció detallada dels tipus d'aprenentatge automàtic juntament amb els seus respectius algorismes:

1. Aprenentatge automàtic supervisat

Com el seu nom indica, Aprenentatge automàtic supervisat es basa en la supervisió. Vol dir que en la tècnica d'aprenentatge supervisat, entrenem les màquines utilitzant el conjunt de dades 'etiquetat' i, en funció de l'entrenament, la màquina prediu la sortida. Aquí, les dades etiquetades especifiquen que algunes de les entrades ja estan assignades a la sortida. Més preuadament, podem dir; primer, entrenem la màquina amb l'entrada i la sortida corresponent, i després demanem a la màquina que predigui la sortida mitjançant el conjunt de dades de prova.

Entenem l'aprenentatge supervisat amb un exemple. Suposem que tenim un conjunt de dades d'entrada d'imatges de gats i gossos. Per tant, primer, proporcionarem la formació a la màquina per entendre les imatges, com ara el forma i mida de la cua de gat i gos, forma dels ulls, color, alçada (els gossos són més alts, els gats són més petits), etc. Un cop finalitzat l'entrenament, introduïm la imatge d'un gat i demanem a la màquina que identifiqui l'objecte i prediu la sortida. Ara, la màquina està ben entrenada, així que comprovarà totes les característiques de l'objecte, com ara l'alçada, la forma, el color, els ulls, les orelles, la cua, etc., i comprovarà que es tracta d'un gat. Per tant, el posarà a la categoria Gat. Aquest és el procés de com la màquina identifica els objectes a l'aprenentatge supervisat.

L'objectiu principal de la tècnica d'aprenentatge supervisat és mapar la variable d'entrada (x) amb la variable de sortida (y). Algunes aplicacions del món real de l'aprenentatge supervisat són Avaluació de riscos, detecció de fraus, filtratge de correu brossa, etc.

Categories d'aprenentatge automàtic supervisat

L'aprenentatge automàtic supervisat es pot classificar en dos tipus de problemes, que es detallen a continuació:

    Classificació Regressió

a) Classificació

Els algorismes de classificació s'utilitzen per resoldre els problemes de classificació en què la variable de sortida és categòrica, com ara ' Sí o No, Home o Dona, Vermell o Blau, etc . Els algorismes de classificació prediuen les categories presents al conjunt de dades. Alguns exemples reals d'algorismes de classificació són Detecció de correu brossa, filtratge de correu electrònic, etc.

eol en python

A continuació es donen alguns algorismes de classificació populars:

    Algoritme forestal aleatori Algoritme de l'arbre de decisions Algorisme de regressió logística Suport a l'algoritme de màquina vectorial

b) Regressió

Els algorismes de regressió s'utilitzen per resoldre problemes de regressió en què hi ha una relació lineal entre les variables d'entrada i de sortida. S'utilitzen per predir variables de sortida contínues, com ara tendències del mercat, predicció del temps, etc.

A continuació es donen alguns algorismes de regressió populars:

    Algorisme de regressió lineal simple Algorisme de regressió multivariant Algoritme de l'arbre de decisions Regressió del lazo

Avantatges i inconvenients de l'aprenentatge supervisat

Avantatges:

  • Des de l'aprenentatge supervisat treballem amb el conjunt de dades etiquetat perquè puguem tenir una idea exacta sobre les classes d'objectes.
  • Aquests algorismes són útils per predir la sortida a partir de l'experiència prèvia.

Desavantatges:

  • Aquests algorismes no són capaços de resoldre tasques complexes.
  • Pot predir la sortida incorrecta si les dades de prova són diferents de les dades d'entrenament.
  • Requereix molt temps de càlcul per entrenar l'algorisme.

Aplicacions de l'aprenentatge supervisat

A continuació es mostren algunes aplicacions habituals de l'aprenentatge supervisat:

    Segmentació de la imatge:
    Els algorismes d'aprenentatge supervisat s'utilitzen en la segmentació d'imatges. En aquest procés, la classificació d'imatges es realitza sobre diferents dades d'imatge amb etiquetes predefinides.Diagnòstic mèdic:
    Els algorismes supervisats també s'utilitzen en l'àmbit mèdic amb finalitats de diagnòstic. Es fa mitjançant l'ús d'imatges mèdiques i dades d'etiquetes anteriors amb etiquetes per a condicions de malaltia. Amb aquest procés, la màquina pot identificar una malaltia per als nous pacients.Detecció de frau -Els algorismes de classificació d'aprenentatge supervisat s'utilitzen per identificar transaccions de frau, clients de frau, etc. Es fa utilitzant dades històriques per identificar els patrons que poden conduir a possibles fraus.Detecció de correu brossa -En la detecció i el filtratge de correu brossa, s'utilitzen algorismes de classificació. Aquests algorismes classifiquen un correu electrònic com a correu brossa o no. Els correus electrònics de correu brossa s'envien a la carpeta de correu brossa.Reconeixement de veu -Els algorismes d'aprenentatge supervisat també s'utilitzen en el reconeixement de veu. L'algorisme s'entrena amb dades de veu i es poden fer diverses identificacions utilitzant-los, com ara contrasenyes activades per veu, ordres de veu, etc.

2. Aprenentatge automàtic no supervisat

Aprenentatge no supervisat g és diferent de la tècnica d'aprenentatge supervisat; com el seu nom indica, no hi ha necessitat de supervisió. Significa que, en l'aprenentatge automàtic no supervisat, la màquina s'entrena utilitzant el conjunt de dades sense etiqueta i la màquina prediu la sortida sense cap supervisió.

En l'aprenentatge no supervisat, els models s'entrenen amb les dades que no estan classificades ni etiquetades, i el model actua sobre aquestes dades sense cap supervisió.

L'objectiu principal de l'algorisme d'aprenentatge no supervisat és agrupar o classificar el conjunt de dades no ordenat segons les semblances, els patrons i les diferències. Les màquines reben instruccions per trobar els patrons ocults del conjunt de dades d'entrada.

Posem un exemple per entendre-ho més preciós; Suposem que hi ha una cistella d'imatges de fruita i l'introduïm al model d'aprenentatge automàtic. Les imatges són totalment desconegudes pel model, i la tasca de la màquina és trobar els patrons i categories dels objectes.

if else declaració en java

Per tant, ara la màquina descobrirà els seus patrons i diferències, com ara la diferència de color, la diferència de forma i predirà la sortida quan es prova amb el conjunt de dades de prova.

Categories d'aprenentatge automàtic no supervisat

L'aprenentatge no supervisat es pot classificar en dos tipus, que es detallen a continuació:

    Agrupació Associació

1) Agrupació

La tècnica de clustering s'utilitza quan volem trobar els grups inherents a partir de les dades. És una manera d'agrupar els objectes en un clúster de manera que els objectes amb més semblances romanguin en un grup i tinguin menys o cap semblança amb els objectes d'altres grups. Un exemple de l'algorisme de clustering és l'agrupació dels clients segons el seu comportament de compra.

A continuació es mostren alguns dels algorismes de agrupació populars:

    Algorisme de agrupació K-Means Algorisme de desplaçament mitjà Algoritme DBSCAN Anàlisi de components principals Anàlisi independent de components

2) Associació

L'aprenentatge de regles d'associació és una tècnica d'aprenentatge no supervisat, que troba relacions interessants entre variables dins d'un gran conjunt de dades. L'objectiu principal d'aquest algorisme d'aprenentatge és trobar la dependència d'un element de dades sobre un altre element de dades i mapejar aquestes variables en conseqüència perquè pugui generar el màxim benefici. Aquest algorisme s'aplica principalment a Anàlisi de cistella de mercat, mineria d'ús web, producció contínua , etc.

llocs com coomeet

Alguns algorismes populars d'aprenentatge de regles d'associació són Algoritme Apriori, Eclat, algorisme de creixement FP.

Avantatges i desavantatges de l'algoritme d'aprenentatge no supervisat

Avantatges:

  • Aquests algorismes es poden utilitzar per a tasques complicades en comparació amb les supervisades perquè aquests algorismes funcionen en el conjunt de dades sense etiquetar.
  • Els algorismes no supervisats són preferibles per a diverses tasques, ja que obtenir el conjunt de dades sense etiqueta és més fàcil en comparació amb el conjunt de dades etiquetat.

Desavantatges:

  • La sortida d'un algorisme no supervisat pot ser menys precisa, ja que el conjunt de dades no està etiquetat i els algorismes no s'entrenen amb la sortida exacta anterior.
  • Treballar amb l'aprenentatge no supervisat és més difícil, ja que funciona amb el conjunt de dades sense etiqueta que no s'assigna amb la sortida.

Aplicacions de l'aprenentatge no supervisat

    Anàlisi de la xarxa:L'aprenentatge no supervisat s'utilitza per identificar el plagi i els drets d'autor en l'anàlisi de xarxes de documents de dades de text per a articles acadèmics.Sistemes de recomanació:Els sistemes de recomanació utilitzen àmpliament tècniques d'aprenentatge no supervisat per crear aplicacions de recomanació per a diferents aplicacions web i llocs web de comerç electrònic.Detecció d'anomalies:La detecció d'anomalies és una aplicació popular d'aprenentatge no supervisat, que pot identificar punts de dades inusuals dins del conjunt de dades. S'utilitza per descobrir transaccions fraudulentes.Descomposició de valors singulars:La descomposició de valors singulars o SVD s'utilitza per extreure informació particular de la base de dades. Per exemple, extreure informació de cada usuari situat en una ubicació determinada.

3. Aprenentatge semitutelat

L'aprenentatge semisupervisat és un tipus d'algorisme d'aprenentatge automàtic que es troba entre l'aprenentatge automàtic supervisat i no supervisat. . Representa el terreny intermedi entre els algorismes d'aprenentatge supervisat (amb dades d'entrenament etiquetades) i d'aprenentatge no supervisat (sense dades d'entrenament etiquetades) i utilitza la combinació de conjunts de dades etiquetats i no etiquetats durant el període d'entrenament.

A Tot i que l'aprenentatge semi-supervisat és el punt intermedi entre l'aprenentatge supervisat i l'aprenentatge no supervisat i funciona amb les dades que consisteixen en unes quantes etiquetes, la majoria consisteix en dades sense etiquetar. Com que les etiquetes són costoses, però per a finalitats corporatives, poden tenir poques etiquetes. És completament diferent de l'aprenentatge supervisat i no supervisat, ja que es basen en la presència i absència d'etiquetes.

Per superar els inconvenients de l'aprenentatge supervisat i els algorismes d'aprenentatge no supervisat, s'introdueix el concepte d'aprenentatge semi-supervisat. . L'objectiu principal de l'aprenentatge semisupervisat és utilitzar de manera efectiva totes les dades disponibles, en lloc de només dades etiquetades com en l'aprenentatge supervisat. Inicialment, dades similars s'agrupen juntament amb un algorisme d'aprenentatge no supervisat i, a més, ajuda a etiquetar les dades sense etiquetar en dades etiquetades. És perquè les dades etiquetades són una adquisició comparativament més cara que les dades sense etiquetar.

Podem imaginar aquests algorismes amb un exemple. L'aprenentatge supervisat és quan un estudiant està sota la supervisió d'un instructor a casa i a la universitat. A més, si aquest estudiant s'autoanalitza el mateix concepte sense cap ajuda de l'instructor, es tracta d'un aprenentatge no supervisat. Sota l'aprenentatge semi-supervisat, l'estudiant ha de revisar-se després d'analitzar el mateix concepte sota la guia d'un instructor a la universitat.

Avantatges i inconvenients de l'aprenentatge semitutelat

Avantatges:

  • És senzill i fàcil d'entendre l'algorisme.
  • És altament eficient.
  • S'utilitza per resoldre els inconvenients dels algorismes d'aprenentatge supervisat i no supervisat.

Desavantatges:

  • Els resultats de les iteracions poden no ser estables.
  • No podem aplicar aquests algorismes a dades a nivell de xarxa.
  • La precisió és baixa.

4. Aprenentatge de reforç

L'aprenentatge de reforç funciona en un procés basat en retroalimentació, en el qual un agent d'IA (un component de programari) explora automàticament el seu entorn colpejant i rastrejant, actuant, aprenent de les experiències i millorant-ne el rendiment. L'agent és recompensat per cada bona acció i castigat per cada mala acció; per tant, l'objectiu de l'agent d'aprenentatge de reforç és maximitzar les recompenses.

En l'aprenentatge de reforç, no hi ha dades etiquetades com l'aprenentatge supervisat, i els agents només aprenen de les seves experiències.

El procés d'aprenentatge de reforç és semblant a un ésser humà; per exemple, un nen aprèn diverses coses per experiències en el seu dia a dia. Un exemple d'aprenentatge de reforç és jugar un joc, on el Joc és l'entorn, els moviments d'un agent a cada pas defineixen estats i l'objectiu de l'agent és aconseguir una puntuació alta. L'agent rep comentaris en termes de càstig i recompenses.

Per la seva manera de treballar, l'aprenentatge de reforç s'empra en diferents camps com ara Teoria de jocs, investigació operativa, teoria de la informació, sistemes multiagent.

Un problema d'aprenentatge de reforç es pot formalitzar utilitzant Procés de decisió de Markov (MDP). En MDP, l'agent interactua constantment amb l'entorn i realitza accions; a cada acció, l'entorn respon i genera un nou estat.

Categories d'aprenentatge de reforç

L'aprenentatge per reforç es classifica principalment en dos tipus de mètodes/algorismes:

cadena d'entrada java
    Aprenentatge de reforç positiu:L'aprenentatge de reforç positiu especifica augmentar la tendència que el comportament requerit es torni a produir afegint alguna cosa. Millora la força del comportament de l'agent i l'impacta positivament.Aprenentatge de reforç negatiu:L'aprenentatge de reforç negatiu funciona exactament al contrari del RL positiu. Augmenta la tendència que el comportament específic es torni a produir evitant la condició negativa.

Casos d'ús reals de l'aprenentatge per reforç

    Videojocs:
    Els algorismes RL són molt populars en aplicacions de jocs. S'utilitza per obtenir un rendiment sobrehumà. Alguns jocs populars que utilitzen algorismes RL són AlphaGO i AlphaGO Zero .Gestió de recursos:
    El document 'Gestió de recursos amb aprenentatge de reforç profund' va mostrar com utilitzar RL a l'ordinador per aprendre automàticament i programar recursos per esperar diferents treballs per tal de minimitzar la desacceleració mitjana del treball.Robòtica:
    RL s'utilitza àmpliament en aplicacions de robòtica. Els robots s'utilitzen a l'àrea industrial i de fabricació, i aquests robots es fan més potents amb l'aprenentatge de reforç. Hi ha diferents indústries que tenen la seva visió de construir robots intel·ligents utilitzant IA i tecnologia d'aprenentatge automàtic.Mineria de textos
    La mineria de text, una de les grans aplicacions de la PNL, s'està implementant ara amb l'ajuda de Reinforcement Learning de l'empresa Salesforce.

Avantatges i inconvenients de l'aprenentatge per reforç

Avantatges

  • Ajuda a resoldre problemes complexos del món real que són difícils de resoldre amb tècniques generals.
  • El model d'aprenentatge de l'RL és semblant a l'aprenentatge dels éssers humans; per tant, es poden trobar els resultats més precisos.
  • Ajuda a aconseguir resultats a llarg termini.

Desavantatge

  • Els algorismes RL no són preferits per a problemes simples.
  • Els algorismes RL requereixen grans dades i càlculs.
  • L'excés d'aprenentatge de reforç pot provocar una sobrecàrrega d'estats que pot debilitar els resultats.

La maledicció de la dimensionalitat limita l'aprenentatge de reforç per a sistemes físics reals.