logo

Regression versus classificació en aprenentatge automàtic

Els algorismes de regressió i classificació són algorismes d'aprenentatge supervisat. Tots dos algorismes s'utilitzen per a la predicció a l'aprenentatge automàtic i funcionen amb els conjunts de dades etiquetats. Però la diferència entre tots dos és com s'utilitzen per a diferents problemes d'aprenentatge automàtic.

La principal diferència entre els algorismes de regressió i classificació a la qual s'utilitzen els algorismes de regressió predir el continu valors com ara el preu, el salari, l'edat, etc. i els algorismes de classificació s'utilitzen predir/classificar els valors discrets com ara Home o Female, True or False, Spam o Not Spam, etc.

nom de la ciutat dels EUA

Considereu el diagrama següent:

Regression vs Classificació

Classificació:

La classificació és un procés per trobar una funció que ajuda a dividir el conjunt de dades en classes basades en diferents paràmetres. A Classificació, un programa informàtic s'entrena en el conjunt de dades d'entrenament i, en funció d'aquesta formació, classifica les dades en diferents classes.

La tasca de l'algorisme de classificació és trobar la funció de mapeig per mapar l'entrada (x) a la sortida discreta (y).

Exemple: El millor exemple per entendre el problema de classificació és la detecció de correu brossa. El model s'entrena a partir de milions de correus electrònics en diferents paràmetres, i sempre que rep un correu electrònic nou, identifica si el correu electrònic és spam o no. Si el correu electrònic és correu brossa, es mou a la carpeta Correu brossa.

Tipus d'algoritmes de classificació ML:

Els algorismes de classificació es poden dividir en els següents tipus:

configuració del camí de Python
  • Regressió logística
  • K-Veïns més propers
  • Suport a les màquines vectorials
  • SVM del nucli
  • Nave Bayes
  • Classificació de l'arbre de decisions
  • Classificació forestal aleatòria

Regressió:

La regressió és un procés per trobar les correlacions entre variables dependents i independents. Ajuda a predir les variables contínues com la predicció de Tendències del mercat , predicció dels preus de l'habitatge, etc.

La tasca de l'algorisme de regressió és trobar la funció de mapeig per assignar la variable d'entrada (x) a la variable de sortida contínua (y).

Exemple: Suposem que volem fer pronòstic del temps, així que per a això, utilitzarem l'algorisme de regressió. En la predicció del temps, el model s'entrena amb les dades passades i, un cop finalitzat l'entrenament, pot predir fàcilment el temps per als dies futurs.

Tipus d'algorisme de regressió:

  • Regresió lineal simple
  • Regressió lineal múltiple
  • Regressió polinòmica
  • Suport a la regressió vectorial
  • Regression de l'arbre de decisions
  • Regression forestal aleatòria

Diferència entre regressió i classificació

Algorisme de regressió Algorisme de classificació
En regressió, la variable de sortida ha de ser de naturalesa contínua o valor real. A Classificació, la variable de sortida ha de ser un valor discret.
La tasca de l'algorisme de regressió és mapar el valor d'entrada (x) amb la variable de sortida contínua (y). La tasca de l'algorisme de classificació és mapar el valor d'entrada (x) amb la variable de sortida discreta (y).
S'utilitzen algorismes de regressió amb dades contínues. Els algorismes de classificació s'utilitzen amb dades discretes.
A la regressió, intentem trobar la millor línia d'ajust, que pot predir la sortida amb més precisió. A Classificació, intentem trobar el límit de decisió, que pot dividir el conjunt de dades en diferents classes.
Els algorismes de regressió es poden utilitzar per resoldre problemes de regressió com ara la predicció del temps, la predicció del preu de l'habitatge, etc. Els algorismes de classificació es poden utilitzar per resoldre problemes de classificació com la identificació de correus brossa, el reconeixement de veu, la identificació de cèl·lules canceroses, etc.
L'algoritme de regressió es pot dividir en regressió lineal i no lineal. Els algorismes de classificació es poden dividir en Classificador binari i Classificador multiclasse.