La regressió lineal i la regressió logística són els dos famosos algorismes d'aprenentatge automàtic que es troben sota la tècnica d'aprenentatge supervisat. Com que els dos algorismes són de naturalesa supervisada, aquests algorismes utilitzen un conjunt de dades etiquetat per fer les prediccions. Però la principal diferència entre ells és com s'utilitzen. La regressió lineal s'utilitza per resoldre problemes de regressió mentre que la regressió logística s'utilitza per resoldre els problemes de classificació. La descripció dels dos algorismes es dóna a continuació juntament amb la taula de diferències.
Regressió lineal:
- La regressió lineal és un dels algorismes d'aprenentatge automàtic més senzills que inclou la tècnica d'aprenentatge supervisat i que s'utilitza per resoldre problemes de regressió.
- S'utilitza per predir la variable dependent contínua amb l'ajuda de variables independents.
- L'objectiu de la regressió lineal és trobar la millor línia d'ajust que pugui predir amb precisió la sortida de la variable dependent contínua.
- Si s'utilitza una sola variable independent per a la predicció, s'anomena regressió lineal simple i si hi ha més de dues variables independents, aquesta regressió s'anomena regressió lineal múltiple.
- En trobar la millor línia d'ajust, l'algorisme estableix la relació entre la variable dependent i la variable independent. I la relació hauria de ser de naturalesa lineal.
- La sortida de la regressió lineal només hauria de ser els valors continus com ara el preu, l'edat, el salari, etc. La relació entre la variable dependent i la variable independent es pot mostrar a la imatge següent:
A la imatge de dalt, la variable dependent es troba a l'eix Y (salari) i la variable independent es troba a l'eix X (experiència). La recta de regressió es pot escriure com:
y= a<sub>0</sub>+a<sub>1</sub>x+ ε
On, a0i a1són els coeficients i ε és el terme d'error.
Regressió logística:
- La regressió logística és un dels algorismes d'aprenentatge automàtic més populars que inclou tècniques d'aprenentatge supervisat.
- Es pot utilitzar tant per a problemes de classificació com per a problemes de regressió, però s'utilitza principalment per a problemes de classificació.
- La regressió logística s'utilitza per predir la variable dependent categòrica amb l'ajuda de variables independents.
- La sortida del problema de regressió logística només pot estar entre 0 i 1.
- La regressió logística es pot utilitzar quan es requereixen les probabilitats entre dues classes. Com ara si avui plourà o no, 0 o 1, vertader o fals, etc.
- La regressió logística es basa en el concepte d'estimació de màxima probabilitat. Segons aquesta estimació, les dades observades haurien de ser les més probables.
- En la regressió logística, passem la suma ponderada de les entrades a través d'una funció d'activació que pot mapar valors entre 0 i 1. Aquesta funció d'activació es coneix com a funció sigmoide i la corba obtinguda s'anomena corba sigmoide o corba S. Considereu la imatge següent:
- L'equació de regressió logística és:
Diferència entre regressió lineal i regressió logística:
Regressió lineal | Regressió logística |
---|---|
La regressió lineal s'utilitza per predir la variable dependent contínua utilitzant un conjunt determinat de variables independents. | La regressió logística s'utilitza per predir la variable dependent categòrica utilitzant un conjunt determinat de variables independents. |
La regressió lineal s'utilitza per resoldre problemes de regressió. | La regressió logística s'utilitza per resoldre problemes de classificació. |
A la regressió lineal, predim el valor de les variables contínues. | A la regressió logística, predim els valors de les variables categòriques. |
En la regressió lineal, trobem la millor línia d'ajust, mitjançant la qual podem predir fàcilment la sortida. | A la regressió logística, trobem la corba S per la qual podem classificar les mostres. |
Per a l'estimació de la precisió s'utilitza el mètode d'estimació de mínims quadrats. | S'utilitza el mètode d'estimació de la màxima versemblança per a l'estimació de la precisió. |
La sortida per a la regressió lineal ha de ser un valor continu, com ara el preu, l'edat, etc. | La sortida de la regressió logística ha de ser un valor categòric com ara 0 o 1, Sí o No, etc. |
En regressió lineal, es requereix que la relació entre variable dependent i variable independent sigui lineal. | En regressió logística, no cal tenir la relació lineal entre la variable dependent i la variable independent. |
En la regressió lineal, pot haver-hi colinealitat entre les variables independents. | En la regressió logística, no hi hauria d'haver colinealitat entre la variable independent. |