En aquest article, aprendrem a utilitzar la funció lm() per ajustar models lineals al llenguatge de programació R.
S'utilitza un model lineal per predir el valor d'una variable desconeguda a partir de variables independents. S'utilitza principalment per esbrinar la relació entre variables i previsió. La funció lm() s'utilitza per ajustar models lineals a marcs de dades en el llenguatge R. Es pot utilitzar per dur a terme la regressió, l'anàlisi de la variància d'un sol estrat i l'anàlisi de la covariància per predir el valor corresponent a les dades que no es troben en el marc de dades. Són molt útils per predir el preu dels béns immobles, la previsió meteorològica, etc.
Per ajustar un model lineal al llenguatge R utilitzant el lm() Primer utilitzem la funció data.frame() per crear un marc de dades de mostra que contingui valors que s'han d'ajustar a un model lineal mitjançant la funció de regressió. A continuació, utilitzem la funció lm() per ajustar una funció determinada a un marc de dades donat.
Sintaxi:
lm( fitting_formula, dataframe )
Paràmetre:
fitting_formula: determina la fórmula del model lineal. marc de dades: determina el nom del marc de dades que conté les dades.
Aleshores, podem utilitzar la funció summary() per veure el resum del model lineal. La funció summary() interpreta els valors estadístics més importants per a l'anàlisi del model lineal.
sintaxi git pull
Sintaxi:
resum (model_lineal)
El resum conté la següent informació clau:
- Error estàndard residual: determina la desviació estàndard de l'error on l'arrel quadrada de la variància resta n menys 1 + # de variables implicades en lloc de dividir per n-1. R-Squared múltiple: determina com s'adapta el vostre model a les dades. R-Squared ajustat: normalitza el quadrat R múltiple tenint en compte quantes mostres teniu i quantes variables esteu utilitzant. F-Statistic: és una prova global que verifica si almenys un dels teus coeficients és diferent de zero.
Exemple: Exemple per mostrar l'ús de la funció lm().
R
# sample data frame> df <->data.frame>( x=>c>(1,2,3,4,5),> >y=>c>(1,5,8,15,26))> > # fit linear model> linear_model <->lm>(y ~ x^2, data=df)> > # view summary of linear model> summary>(linear_model)> |
>
>
Sortida:
Anomenada:
lm(fórmula = y ~ x^2, dades = df)
Residus:
1 2 3 4 5
2.000e+00 5.329e-15 -3.000e+00 -2.000e+00 3.000e+00
Coeficients:
Estimació Std. Error t valor Pr(>|t|)
(Intercepció) -7,0000 3,0876 -2,267 0,10821
x 6,0000 0,9309 6,445 0,00757 **
—
Signif. codis: 0 '***' 0,001 '**' 0,01 '*' 0,05 '.' 0,1 '' 1
Error estàndard residual: 2.944 en 3 graus de llibertat
R-quadrat múltiple: 0,9326, R-quadrat ajustat: 0,9102
Estadística F: 41,54 en 1 i 3 DF, valor p: 0,007575
Trames de diagnòstic
Els diagrames de diagnòstic ens ajuden a veure la relació entre diferents valors estadístics del model. Ens ajuda a analitzar l'extensió dels valors atípics i l'eficiència del model ajustat. Per veure els diagrames de diagnòstic d'un model lineal, utilitzem la funció plot() en el llenguatge R.
Sintaxi:
trama (model_lineal)
Exemple: Gràfics de diagnòstic per al model lineal ajustat anteriorment.
R
# sample data frame> df <->data.frame>( x=>c>(1,2,3,4,5),> >y=>c>(1,5,8,15,26))> > # fit linear model> linear_model <->lm>(y ~ x^2, data=df)> > # view diagnostic plot> plot>(linear_model)> |
>
>
Sortida:

Representació del model lineal
Podem representar el model lineal ajustat anteriorment per visualitzar-lo bé mitjançant el mètode abline(). Primer tracem un gràfic de dispersió de punts de dades i després el superposem amb un gràfic abline del model lineal mitjançant la funció abline().
Sintaxi:
trama (df$x, df$y)
què és mavenabline (model_lineal)
Exemple: Representació del model lineal
R
cadena a int
# sample data frame> df <->data.frame>( x=>c>(1,2,3,4,5),> >y=>c>(1,5,8,15,26))> > # fit linear model> linear_model <->lm>(y ~ x^2, data=df)> > # Plot abline plot> plot>( df$x, df$y )> abline>( linear_model)> |
>
>
Sortida:

Prediu els valors de punts de dades desconeguts mitjançant el model ajustat
Per predir valors per a noves entrades utilitzant el model lineal ajustat anteriorment, utilitzem la funció predict(). La funció predict() pren el model i el marc de dades amb punts de dades desconeguts i prediu el valor de cada punt de dades segons el model ajustat.
Sintaxi:
predir (model, dades)
Paràmetre:
model: determina el model lineal. dades: determina el marc de dades amb punts de dades desconeguts.
Exemple: Predicció de noves entrades
R
# sample data frame> df <->data.frame>( x=>c>(1,2,3,4,5),> >y=>c>(1,5,8,15,26))> > # fit linear model> linear_model <->lm>(y ~ x^2, data=df)> > # Predict values> predict>( linear_model, newdata =>data.frame>(x=>c>(15,16,17)) )> |
>
>
Sortida:
1 2 3 83 89 95>