logo

R – Marcs de dades

Llenguatge de programació R és un llenguatge de programació de codi obert que s'utilitza àmpliament com a programari estadístic i eina d'anàlisi de dades. Marcs de dades en llenguatge R són objectes de dades genèrics de R que s'utilitzen per emmagatzemar dades tabulars.

Els marcs de dades també es poden interpretar com a matrius on cada columna de a matriu poden ser de diferents tipus de dades. R DataFrame està format per tres components principals, les dades, les files i les columnes.



R Estructura de marcs de dades

Com podeu veure a la imatge següent, així s'estructura un marc de dades.

Les dades es presenten en forma de taula, la qual cosa facilita el funcionament i la comprensió.

R - Marcs de dadesGeeksforgeeks

R – Marcs de dades



Crear Dataframe en llenguatge de programació R

Per crear un marc de dades R, utilitzeu data.frame() funció i després passa cadascun dels vectors que has creat com a arguments a la funció.

R






# R program to create dataframe> # creating a data frame> friend.data <->data.frame>(> >friend_id =>c>(1:5),> >friend_name =>c>(>'Sachin'>,>'Sourav'>,> >'Dravid'>,>'Sehwag'>,> >'Dhoni'>),> >stringsAsFactors =>FALSE> )> # print the data frame> print>(friend.data)>

>

>

Sortida:

 friend_id friend_name 1 1 Sachin 2 2 Sourav 3 3 Dravid 4 4 Sehwag 5 5 Dhoni>

Obteniu l'estructura del marc de dades R

Es pot obtenir l'estructura del marc de dades R utilitzant str() funció en R.

Pot mostrar fins i tot l'estructura interna de llistes grans que estan imbricades. Proporciona una sortida d'una línia per als objectes R bàsics que permeten a l'usuari conèixer l'objecte i els seus components.

R




diferència de data excel

# R program to get the> # structure of the data frame> # creating a data frame> friend.data <->data.frame>(> >friend_id =>c>(1:5),> >friend_name =>c>(>'Sachin'>,>'Sourav'>,> >'Dravid'>,>'Sehwag'>,> >'Dhoni'>),> >stringsAsFactors =>FALSE> )> # using str()> print>(>str>(friend.data))>

>

>

Sortida:

'data.frame': 5 obs. of 2 variables:  $ friend_id : int 1 2 3 4 5  $ friend_name: chr 'Sachin' 'Sourav' 'Dravid' 'Sehwag' ... NULL>

Resum de dades al marc de dades R

En el marc de dades R, es pot obtenir el resum estadístic i la naturalesa de les dades aplicant resum () funció.

És una funció genèrica que s'utilitza per produir resums de resultats dels resultats de diverses funcions d'ajust del model. La funció invoca mètodes particulars que depenen de la classe del primer argument.

R




# R program to get the> # summary of the data frame> # creating a data frame> friend.data <->data.frame>(> >friend_id =>c>(1:5),> >friend_name =>c>(>'Sachin'>,>'Sourav'>,> >'Dravid'>,>'Sehwag'>,> >'Dhoni'>),> >stringsAsFactors =>FALSE> )> # using summary()> print>(>summary>(friend.data))>

>

>

Sortida:

 friend_id friend_name   Min. :1 Length:5   1st Qu.:2 Class :character   Median :3 Mode :character   Mean :3   3rd Qu.:4   Max. :5>

Extreu dades del marc de dades a R

L'extracció de dades d'un marc de dades R significa que accedir a les seves files o columnes. Es pot extreure una columna específica d'un marc de dades R utilitzant el seu nom de columna.

R




# R program to extract> # data from the data frame> # creating a data frame> friend.data <->data.frame>(> >friend_id =>c>(1:5),> >friend_name =>c>(>'Sachin'>,>'Sourav'>,> >'Dravid'>,>'Sehwag'>,> >'Dhoni'>),> >stringsAsFactors =>FALSE> )> # Extracting friend_name column> result <->data.frame>(friend.data$friend_name)> print>(result)>

>

>

Sortida:

 friend.data.friend_name 1 Sachin 2 Sourav 3 Dravid 4 Sehwag 5 Dhoni>

Amplieu el marc de dades en llenguatge R

Un marc de dades a R es pot ampliar afegint columnes i files noves al marc de dades R ja existent.

R

connectar-se a una base de dades java




# R program to expand> # the data frame> # creating a data frame> friend.data <->data.frame>(> >friend_id =>c>(1:5),> >friend_name =>c>(>'Sachin'>,>'Sourav'>,> >'Dravid'>,>'Sehwag'>,> >'Dhoni'>),> >stringsAsFactors =>FALSE> )> # Expanding data frame> friend.data$location <->c>(>'Kolkata'>,>'Delhi'>,> >'Bangalore'>,>'Hyderabad'>,> >'Chennai'>)> resultant <- friend.data> # print the modified data frame> print>(resultant)>

>

>

Sortida:

 friend_id friend_name location 1 1 Sachin Kolkata 2 2 Sourav Delhi 3 3 Dravid Bangalore 4 4 Sehwag Hyderabad 5 5 Dhoni Chennai>

A R, es poden realitzar diversos tipus d'operacions en un marc de dades com accedir a files i columnes, seleccionar el subconjunt del marc de dades, editar marcs de dades, eliminar files i columnes en un marc de dades , etc.

Si us plau refereix-te a Operacions de DataFrame a R per conèixer tot tipus d'operacions que es poden realitzar en un marc de dades.

Accediu als elements del marc de dades R

Podem seleccionar i accedir a qualsevol element del marc de dades utilitzant single$>, parèntesis[ ] or>dobles claudàtors[[]]>per accedir a les columnes des d'un marc de dades.

R




# creating a data frame> friend.data <->data.frame>(> >friend_id =>c>(1:5),> >friend_name =>c>(>'Sachin'>,>'Sourav'>,> >'Dravid'>,>'Sehwag'>,> >'Dhoni'>),> >stringsAsFactors =>FALSE> )> # Access Items using []> friend.data[1]> # Access Items using [[]]> friend.data[[>'friend_name'>]]> # Access Items using $> friend.data$friend_id>

>

>

Sortida:

 friend_id 1 1 2 2 3 3 4 4 5 5 Access Items using [[]] [1] 'Sachin' 'Sourav' 'Dravid' 'Sehwag' 'Dhoni'   Access Items using $ [1] 1 2 3 4 5>

Quantitat de files i columnes

Podem esbrinar quantes files i columnes parsant al nostre marc de dades mitjançant la funció dim.

R




# creating a data frame> friend.data <->data.frame>(> >friend_id =>c>(1:5),> >friend_name =>c>(>'Sachin'>,>'Sourav'>,> >'Dravid'>,>'Sehwag'>,> >'Dhoni'>),> >stringsAsFactors =>FALSE> )> # find out the number of rows and clumns> dim>(friend.data)>

>

>

Sortida:

[1] 5 2>

Afegiu files i columnes al marc de dades R

Podeu afegir fàcilment files i columnes en un R DataFrame. La inserció ajuda a expandir el DataFrame ja existent, sense necessitar-ne un de nou.

Vegem com afegir files i columnes en un DataFrame? amb un exemple:

Afegiu files al marc de dades R

Per afegir files en un marc de dades, podeu utilitzar una funció integrada rbind().

L'exemple següent mostra el funcionament de rbind() a R Data Frame.

R




# Creating a dataframe representing products in a store> Products <->data.frame>(> >Product_ID =>c>(101, 102, 103),> >Product_Name =>c>(>'T-Shirt'>,>'Jeans'>,>'Shoes'>),> >Price =>c>(15.99, 29.99, 49.99),> >Stock =>c>(50, 30, 25)> )> # Print the existing dataframe> cat>(>'Existing dataframe (Products): '>)> print>(Products)> # Adding a new row for a new product> New_Product <->c>(104,>'Sunglasses'>, 39.99, 40)> Products <->rbind>(Products, New_Product)> # Print the updated dataframe after adding the new product> cat>(>' Updated dataframe after adding a new product: '>)> print>(Products)>

>

>

Sortida:

Existing dataframe (Products):   Product_ID Product_Name Price Stock 1 101 T-Shirt 15.99 50 2 102 Jeans 29.99 30 3 103 Shoes 49.99 25  Updated dataframe after adding a new product:   Product_ID Product_Name Price Stock 1 101 T-Shirt 15.99 50 2 102 Jeans 29.99 30 3 103 Shoes 49.99 25 4 104 Sunglasses 39.99 40>

Afegiu columnes al marc de dades R

Per afegir columnes en un marc de dades, podeu utilitzar una funció integrada cbind().

L'exemple següent mostra el funcionament de cbind() a R Data Frame .

com obtenir una data actual en java

R




# Existing dataframe representing products in a store> Products <->data.frame>(> >Product_ID =>c>(101, 102, 103),> >Product_Name =>c>(>'T-Shirt'>,>'Jeans'>,>'Shoes'>),> >Price =>c>(15.99, 29.99, 49.99),> >Stock =>c>(50, 30, 25)> )> # Print the existing dataframe> cat>(>'Existing dataframe (Products): '>)> print>(Products)> # Adding a new column for 'Discount' to the dataframe> Discount <->c>(5, 10, 8)># New column values for discount> Products <->cbind>(Products, Discount)> # Rename the added column> colnames>(Products)[>ncol>(Products)] <->'Discount'> # Renaming the last column> # Print the updated dataframe after adding the new column> cat>(>' Updated dataframe after adding a new column 'Discount': '>)> print>(Products)>

>

>

Sortida:

Existing dataframe (Products):   Product_ID Product_Name Price Stock 1 101 T-Shirt 15.99 50 2 102 Jeans 29.99 30 3 103 Shoes 49.99 25  Updated dataframe after adding a new column 'Discount':   Product_ID Product_Name Price Stock Discount 1 101 T-Shirt 15.99 50 5 2 102 Jeans 29.99 30 10 3 103 Shoes 49.99 25 8>

Elimina files i columnes

Un marc de dades a R elimina columnes i files del marc de dades R ja existent.

Elimina la fila a R DataFrame

R




library>(dplyr)> # Create a data frame> data <->data.frame>(> >friend_id =>c>(1, 2, 3, 4, 5),> >friend_name =>c>(>'Sachin'>,>'Sourav'>,>'Dravid'>,>'Sehwag'>,>'Dhoni'>),> >location =>c>(>'Kolkata'>,>'Delhi'>,>'Bangalore'>,>'Hyderabad'>,>'Chennai'>)> )> data> # Remove a row with friend_id = 3> data <->subset>(data, friend_id != 3)> data>

>

>

Sortida:

 friend_id friend_name location 1 1 Sachin Kolkata 2 2 Sourav Delhi 3 3 Dravid Bangalore 4 4 Sehwag Hyderabad 5 5 Dhoni Chennai   # Remove a row with friend_id = 3   friend_id friend_name location 1 1 Sachin Kolkata 2 2 Sourav Delhi 4 4 Sehwag Hyderabad 5 5 Dhoni Chennai>

Al codi anterior, primer vam crear un marc de dades anomenat dades amb tres columnes: friend_id , nom_amic , i ubicació . Per eliminar una fila amb friend_id igual a 3, hem utilitzat el subconjunt () funció i especificar la condició friend_id != 3 . Això va eliminar la fila amb friend_id igual a 3.

Elimina la columna a R DataFrame

R

jocs de missatges per a Android




library>(dplyr)> # Create a data frame> data <->data.frame>(> >friend_id =>c>(1, 2, 3, 4, 5),> >friend_name =>c>(>'Sachin'>,>'Sourav'>,>'Dravid'>,>'Sehwag'>,>'Dhoni'>),> >location =>c>(>'Kolkata'>,>'Delhi'>,>'Bangalore'>,>'Hyderabad'>,>'Chennai'>)> )> data> # Remove the 'location' column> data <->select>(data, -location)> data>

>

>

Sortida:

 friend_id friend_name location 1 1 Sachin Kolkata 2 2 Sourav Delhi 3 3 Dravid Bangalore 4 4 Sehwag Hyderabad 5 5 Dhoni Chennai>Elimina la columna 'ubicació' friend_id friend_name 1 1 Sachin 2 2 Sourav 3 3 Dravid 4 4 Sehwag 5 5 Dhoni>>> 

Per eliminar el ubicació columna, hem utilitzat la selecciona () funció i especificat -ubicació . El El signe indica que volem eliminar el ubicació columna. El marc de dades resultant dades només tindrà dues columnes: friend_id i nom_amic .

Combinació de marcs de dades a R

Hi ha dues maneres de combinar marcs de dades a R. Podeu combinar-los verticalment o horitzontalment.

Vegem els dos casos amb un exemple:

Combina verticalment el marc de dades R

Si voleu combinar 2 marcs de dades verticalment, podeu utilitzar funció rbind(). Aquesta funció funciona per a la combinació de dos o més marcs de dades.

R




# Creating two sample dataframes> df1 <->data.frame>(> >Name =>c>(>'Alice'>,>'Bob'>),> >Age =>c>(25, 30),> >Score =>c>(80, 75)> )> df2 <->data.frame>(> >Name =>c>(>'Charlie'>,>'David'>),> >Age =>c>(28, 35),> >Score =>c>(90, 85)> )> # Print the existing dataframes> cat>(>'Dataframe 1: '>)> print>(df1)> cat>(>' Dataframe 2: '>)> print>(df2)> # Combining the dataframes using rbind()> combined_df <->rbind>(df1, df2)> # Print the combined dataframe> cat>(>' Combined Dataframe: '>)> print>(combined_df)>

>

Sortida:

Dataframe 1:   Name Age Score 1 Alice 25 80 2 Bob 30 75  Dataframe 2:   Name Age Score 1 Charlie 28 90 2 David 35 85  Combined Dataframe:   Name Age Score 1 Alice 25 80 2 Bob 30 75 3 Charlie 28 90 4 David 35 85>

Combinar el marc de dades R horitzontalment:

Si voleu combinar 2 marcs de dades horitzontalment, podeu utilitzar funció cbind(). Aquesta funció funciona per a la combinació de dos o més marcs de dades.

R




# Creating two sample dataframes> df1 <->data.frame>(> >Name =>c>(>'Alice'>,>'Bob'>),> >Age =>c>(25, 30),> >Score =>c>(80, 75)> )> df2 <->data.frame>(> >Height =>c>(160, 175),> >Weight =>c>(55, 70)> )> # Print the existing dataframes> cat>(>'Dataframe 1: '>)> print>(df1)> cat>(>' Dataframe 2: '>)> print>(df2)> # Combining the dataframes using cbind()> combined_df <->cbind>(df1, df2)> # Print the combined dataframe> cat>(>' Combined Dataframe: '>)> print>(combined_df)>

>

>

Sortida:

Dataframe 1:   Name Age Score 1 Alice 25 80 2 Bob 30 75  Dataframe 2:   Height Weight 1 160 55 2 175 70  Combined Dataframe:   Name Age Score Height Weight 1 Alice 25 80 160 55 2 Bob 30 75 175 70>

Llegeix també:

  • R – Objectes
  • Estructures de dades en programació R

En aquest article hem tractat marcs de dades R, i totes les operacions bàsiques com crear, accedir, resumir, afegir i eliminar. Aquest article pretén familiaritzar-vos amb els marcs de dades en R perquè pugueu utilitzar-los als vostres projectes.

Espero que això us ajudi a entendre el concepte de marcs de dades a R i pugueu implementar fàcilment el marc de dades R als vostres projectes.