logo

Concatenació dels pandes

Pandas és capaç de combinar objectes Series, DataFrame i Panel mitjançant diferents tipus de lògica conjunta per als índexs i la funcionalitat d'àlgebra relacional.

El concat() La funció s'encarrega de realitzar l'operació de concatenació al llarg d'un eix del DataFrame.

Sintaxi:

 pd.concat(objs,axis=0,join='outer',join_axes=None, ignore_index=False) 

Paràmetres:

    objs:És una seqüència o mapeig de sèries o objectes DataFrame.
    Si passem un dictat al DataFrame, les claus ordenades s'utilitzaran com a keys, i els valors es seleccionaran en aquest cas. Si hi ha cap objecte no present, s'eliminarà tret que tots no siguin cap, i en aquest cas, un ValueError s'aixecarà.eix:És un eix per concatenar.uneix-te:Responsable de manejar índexs en un altre eix.join_axes:Una llista d'objectes d'índex. En lloc de realitzar la lògica del conjunt interior o exterior, s'utilitzen índexs específics per a l'altre eix (n-1).ignore_index:bool, valor per defecte Fals
    No utilitza els valors de l'índex a l'eix de concatenació, si és cert. L'eix resultant s'etiquetarà com a 0, ..., n - 1.

Devolucions

Es retorna una sèrie quan concatenem totes les Sèries al llarg de l'eix (eix=0). En cas que si objs conté almenys un DataFrame, retorna un DataFrame.

Exemple 1:

 import pandas as pd a_data = pd.Series(['p', 'q']) b_data = pd.Series(['r', 's']) pd.concat([a_data, b_data]) 

Sortida

números per a l'alfabet
 0 p 1 q 0 r 1 s dtype: object 

Exemple 2: A l'exemple anterior, podem restablir l'índex existent mitjançant l' ignora_índex paràmetre. El codi següent mostra el funcionament de ignora_índex .

 import pandas as pd a_data = pd.Series(['p', 'q']) b_data = pd.Series(['r', 's']) pd.concat([a_data, b_data], ignore_index=True) 

Sortida

 0 p 1 q 2 r 3 s dtype: object 

Exemple 3: Podem afegir un índex jeràrquic al nivell més extern de les dades utilitzant el claus paràmetre.

 import pandas as pd a_data = pd.Series(['p', 'q']) b_data = pd.Series(['r', 's']) pd.concat([a_data, b_data], keys=['a_data', 'b_data']) 

Sortida

 a_data 0 p 1 q b_data 0 r 1 s dtype: object 

Exemple 4: Podem etiquetar les claus d'índex utilitzant el noms paràmetre. El codi següent mostra el funcionament del paràmetre de noms.

 import pandas as pd a_data = pd.Series(['p', 'q']) b_data = pd.Series(['r', 's']) pd.concat([a_data, b_data], keys=['a_data', 'b_data']) pd.concat([a_data, b_data], keys=['a_data', 'b_data'], names=['Series name', 'Row ID']) 

Sortida

 Series name Row ID a_data 0 p 1 q b_data 0 r 1 s dtype: object 

Concatenació mitjançant append

El mètode append es defineix com una drecera útil per concatenar la sèrie i el DataFrame.

Exemple:

excepcions java
 import pandas as pd one = pd.DataFrame({ 'Name': ['Parker', 'Smith', 'Allen', 'John', 'Parker'], 'subject_id':['sub1','sub2','sub4','sub6','sub5'], 'Marks_scored':[98,90,87,69,78]}, index=[1,2,3,4,5]) two = pd.DataFrame({ 'Name': ['Billy', 'Brian', 'Bran', 'Bryce', 'Betty'], 'subject_id':['sub2','sub4','sub3','sub6','sub5'], 'Marks_scored':[89,80,79,97,88]}, index=[1,2,3,4,5]) print (one.append(two)) 

Sortida

 Name subject_id Marks_scored 1 Parker sub1 98 2 Smith sub2 90 3 Allen sub4 87 4 John sub6 69 5 Parker sub5 78 1 Billy sub2 89 2 Brian sub4 80 3 Bran sub3 79 4 Bryce sub6 97 5 Betty sub5 88