logo

Prova de Chi-quadrat a R

El prova de chi quadrat d'independència avalua si hi ha associació entre les categories de les dues variables. Bàsicament hi ha dos tipus de variables aleatòries i donen dos tipus de dades: numèriques i categòriques. En Llenguatge de programació R L'estadística de chi quadrat s'utilitza per investigar si les distribucions de variables categòriques difereixen entre si. La prova de chi quadrat també és útil per comparar els comptes o recomptes de respostes categòriques entre dos (o més) grups independents.

En el llenguatge de programació R, la funció que s'utilitza per realitzar una prova de chi quadrat és chisq.test()> .



Sintaxi:

chisq.test(dades)

ordenar una matriu en java

Paràmetres:



dades : les dades són una taula que conté els valors de recompte de les variables de la taula.

Prenem les dades de l'enquesta al MASS> biblioteca que representa les dades d'una enquesta realitzada als estudiants.

R






# load the MASS package> library>(MASS)> print>(>str>(survey))>

>

>

Sortida:

'data.frame': 237 obs. of 12 variables:  $ Sex : Factor w/ 2 levels 'Female','Male': 1 2 2 2 2 1 2 1 2 2 ...  $ Wr.Hnd: num 18.5 19.5 18 18.8 20 18 17.7 17 20 18.5 ...  $ NW.Hnd: num 18 20.5 13.3 18.9 20 17.7 17.7 17.3 19.5 18.5 ...  $ W.Hnd : Factor w/ 2 levels 'Left','Right': 2 1 2 2 2 2 2 2 2 2 ...  $ Fold : Factor w/ 3 levels 'L on R','Neither',..: 3 3 1 3 2 1 1 3 3 3 ...  $ Pulse : int 92 104 87 NA 35 64 83 74 72 90 ...  $ Clap : Factor w/ 3 levels 'Left','Neither',..: 1 1 2 2 3 3 3 3 3 3 ...  $ Exer : Factor w/ 3 levels 'Freq','None',..: 3 2 2 2 3 3 1 1 3 3 ...  $ Smoke : Factor w/ 4 levels 'Heavy','Never',..: 2 4 3 2 2 2 2 2 2 2 ...  $ Height: num 173 178 NA 160 165 ...  $ M.I : Factor w/ 2 levels 'Imperial','Metric': 2 1 NA 2 2 1 1 2 2 2 ...  $ Age : num 18.2 17.6 16.9 20.3 23.7 ... NULL>

El resultat anterior mostra que el conjunt de dades té moltes variables de factor que es poden considerar variables categòriques. Per al nostre model, tindrem en compte les variables Exer i Fum .La columna Fum registra els hàbits de fumar dels estudiants mentre que la columna Exer registra el seu nivell d'exercici. El nostre objectiu és provar la hipòtesi de si l'hàbit de fumar dels estudiants és independent del seu nivell d'exercici a un nivell de significació de 0,05.

R

què és un hashset en java




# Create a data frame from the main data set.> stu_data =>data.frame>(survey$Smoke,survey$Exer)> # Create a contingency table with the needed variables.> stu_data =>table>(survey$Smoke,survey$Exer)> > print>(stu_data)>

>

>

Sortida:

 Freq None Some  Heavy 7 1 3  Never 87 18 84  Occas 12 3 4  Regul 9 1 7>

I finalment apliquem el chisq.test()> funció a la taula de contingència stu_data.

R




matriu java de cadena
# applying chisq.test() function> print>(>chisq.test>(stu_data))>

>

>

Sortida:

 Pearson's Chi-squared test  data: stu_data X-squared = 5.4885, df = 6, p-value = 0.4828>

Com que el valor p 0,4828 és més gran que el 0,05, concloem que l'hàbit de fumar és independent del nivell d'exercici de l'estudiant i, per tant, hi ha una correlació feble o nul·la entre les dues variables. El codi R complet es mostra a continuació.

Així, en resum, es pot dir que és molt fàcil realitzar una prova de Chi quadrat amb R. Es pot realitzar aquesta tasca utilitzant chisq.test()> funció en R.

Visualitzeu les dades de la prova de Chi-quadrat

R




# Load required library> library>(MASS)> # Print structure of the survey dataset> print>(>str>(survey))> # Create a data frame for smoking and exercise columns> stu_data <->data.frame>(survey$Smoke, survey$Exer)> stu_data <->table>(survey$Smoke, survey$Exer)> # Print the table> print>(stu_data)> # Perform the Chi-Square Test> chi_result <->chisq.test>(stu_data)> print>(chi_result)> # Visualize the data with a bar plot> barplot>(stu_data, beside =>TRUE>, col =>c>(>'lightblue'>,>'lightgreen'>),> >main =>'Smoking Habits vs Exercise Levels'>,> >xlab =>'Exercise Level'>, ylab =>'Number of Students'>)> # Add legend separately> legend>(>'center'>, legend =>rownames>(stu_data), fill =>c>(>'lightblue'>,>'lightgreen'>))>

>

>

java per tipus de bucle

Sortida:

gh

Prova de Chi-quadrat a R

En aquest codi fem servir elMASS>biblioteca per dur a terme una prova de Chi-quadrat sobre el conjunt de dades de l''enquesta', centrada en la relació entre els hàbits de tabaquisme i els nivells d'exercici.

Crea una taula de contingències, realitza la prova estadística i visualitza les dades mitjançant un diagrama de barres. La llegenda s'afegeix per separat a la cantonada superior esquerra, distingint entre diferents hàbits de fumar amb colors diferents.

El codi té com a objectiu explorar i comunicar les associacions entre la conducta de fumar i les pràctiques d'exercici dins del conjunt de dades.