logo

Com combinar dos marcs de dades a Python - Pandas

Pandes

Pandas és una biblioteca integrada a Python que s'utilitza per treballar amb dades relacionals en el llenguatge de programació Python. Té moltes funcions i estructures de dades que ajuden en les operacions de dades relacionals.

Si les dades s'emmagatzemen en forma de files i columnes o dades bidimensionals, generalment s'anomena dataframes en pandas.

Si tenim dos marcs de dades, amb l'ajuda dels pandes, podem combinar-los o combinar-los en un únic marc de dades. Els pandas proporcionen la lògica establerta per combinar les dades de dos marcs de dades diferents, així com la lògica per comparar-los.

1. Utilitzant la funció concat().

A Python, podem concatenar els dos marcs de dades amb l'ajuda de la funció concat() de Pandas. Podem concatenar les dades tant per fila com per columna. Aquesta funció fusiona les dades en un eix (fila o columna) i realitza la lògica establerta en un altre eix (un altre índex).

Exemple:

 import pandas as pd from IPython.display import display # First DataFrame dataFrame1 = pd.DataFrame({'id': ['A1', 'A2', 'A3', 'A4'], 'Name': ['ABC', 'PQR', 'DEF', 'GHI'], 'Marks':[65,69,96,89]}) # Second DataFrame dataFrame2 = pd.DataFrame({'id': ['B1', 'B2', 'B3', 'B4'], 'Name': ['XYZ', 'TUV', 'MNO', 'JKL'], 'Marks':[56,96,69,98]}) frames = [dataFrame1, dataFrame2] result = pd.concat(frames) display(result) 

Sortida:

Com combinar dos marcs de dades a Python - Pandas

Explicació:

Al codi anterior, primer hem importat la biblioteca Pandas al fitxer. A continuació, vam crear els dos marcs de dades on cada marc de dades conté tres columnes i quatre files. A continuació, vam utilitzar la funció concat, que concatena aquests dos marcs de dades en fila, i amb la funció de visualització, ho vam imprimir a la pantalla.

2. Ús d'unions en pandes

Hem entès el concepte d'unions a la base de dades on unim les dues taules en funció d'algun atribut comú. El mateix mètode s'aplica a la concatenació de marcs de dades. Amb el mètode simple concat(), vam fusionar totes les files entre si i vam crear el nou marc de dades. A la unió, definim quin tipus d'unió volem realitzar a la taula, ja sigui una unió interna o una unió externa. Qualsevol tipus d'unió, ja sigui unió interna (intersecció) o unió externa (unió), es definirà a l'atribut join.

Exemple:

variables globals de javascript
 import pandas as pd from IPython.display import display dataFrame1 = pd.DataFrame({'id': ['A1', 'A2', 'A3', 'A4'], 'Name': ['ABC', 'PQR', 'TUV', 'JKL']}) dataFrame2 = pd.DataFrame({'City': ['NOIDA', 'JAIPUR', 'MANALI', 'DELHI'], 'Age': ['11', '10', '12', '17']}) # the default behaviour is join='outer' # inner join result = pd.concat([dataFrame1, dataFrame2], axis=1, join='inner') display(result) 

Sortida:

Com combinar dos marcs de dades a Python - Pandas

Explicació:

Al codi anterior, tenim dos daraframes que contenen dues columnes i quatre files. Tots dos marcs de dades tenen noms de columnes diferents i, a la funció concat(), hem utilitzat la unió interna, que pren la part d'intersecció.

A l'atribut de l'eix, hem inicialitzat el valor 1, de manera que tenim totes les dades.

Exemple:

 import pandas as pd from IPython.display import display dataFrame1 = pd.DataFrame({'id': ['A1', 'A2', 'A3', 'A4'], 'Name': ['ABC', 'PQR', 'TUV', 'JKL']}) dataFrame2 = pd.DataFrame({'id': ['A1', 'A2', 'A3', 'A4'],'City': ['NOIDA', 'JAIPUR', 'MANALI', 'DELHI'], 'Age': ['11', '10', '12', '17']}) # the default behaviour is join='outer' # inner join result = pd.concat([dataFrame1, dataFrame2], axis=0, join='inner') display(result) 

Sortida:

llista de làtex
Com combinar dos marcs de dades a Python - Pandas

Com que no hi ha cap atribut comú i es va aplicar la unió interna, vam obtenir un marc de dades buit com a sortida. Si hi ha un atribut comú en ambdós marcs de dades:

Exemple:

 import pandas as pd from IPython.display import display dataFrame1 = pd.DataFrame({'id': ['A1', 'A2', 'A3', 'A4'], 'Name': ['ABC', 'PQR', 'TUV', 'JKL']}) dataFrame2 = pd.DataFrame({'id': ['B1', 'B2', 'B3', 'B4'], 'City': ['NOIDA', 'JAIPUR', 'MANALI', 'DELHI'], 'Age': ['11', '10', '12', '17']}) # the default behaviour is join='outer' # inner join result = pd.concat([dataFrame1, dataFrame2], axis=0, join='inner') display(result) 

Sortida:

Com combinar dos marcs de dades a Python - Pandas

Explicació:

Al codi anterior, tenim un atribut, 'id', que és comú, de manera que el marc de dades es crea basant-se només en atributs comuns.

3. Utilitzant el mètode append().

En lloc del mètode concat(), podem utilitzar el mètode append(). Aquest mètode append() s'aplica a un dels marcs de dades.

Exemple:

 import pandas as pd from IPython.display import display # First DataFrame dataFrame1 = pd.DataFrame({'id': ['A1', 'A2', 'A3', 'A4'], 'City': ['JAIPUR', 'MANALI', 'NOIDA', 'LUCKNOW']}) # Second DataFrame dataFrame2 = pd.DataFrame({'id': ['B1', 'B2', 'B3', 'B4'], 'City': ['MUMBAI', 'UDAIPUR', 'RISHIKESH', 'KASHMIR']}) # append method result = dataFrame1.append(dataFrame2) display(result) 

Sortida:

Com combinar dos marcs de dades a Python - Pandas

Explicació:

Al codi anterior, hem combinat dos marcs de dades mitjançant el mètode append.