logo

Obteniu valors únics d'una columna a Pandas DataFrame

La funció unique() elimina tots els valors duplicats d'una columna i retorna un únic valor per a diversos valors iguals. En aquest article, parlarem de com podem obtenir valors únics d'una columna Pandas DataFrame .

Creació d'un marc de dades Pandas amb elements duplicats

Creeu un marc de dades de Pandas de mostra amb un diccionari de llistes, per exemple, els noms de les columnes A, B, C, D i E amb elements duplicats.



Python 3

bou vs bou








# Import pandas package> import> pandas as pd> # create a dictionary with five fields each> data>=> {> >'A'>: [>'A1'>,>'A2'>,>'A3'>,>'A4'>,>'A5'>],> >'B'>: [>'B1'>,>'B2'>,>'B3'>,>'B4'>,>'B4'>],> >'C'>: [>'C1'>,>'C2'>,>'C3'>,>'C3'>,>'C3'>],> >'D'>: [>'D1'>,>'D2'>,>'D2'>,>'D2'>,>'D2'>],> >'E'>: [>'E1'>,>'E1'>,>'E1'>,>'E1'>,>'E1'>]}> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)>

>

>

Obteniu valors únics d'una columna a Pandas DataFrame

A continuació es mostren alguns exemples amb els quals podem obtenir els valors únics d'una columna en aquest marc de dades.

  • Obteniu els valors únics de la columna 'B'.
  • Obteniu els valors únics de la columna 'E'.
  • Obteniu el nombre de valors únics en una columna
  • Utilitzant set() per eliminar els valors duplicats d'una columna
  • Utilitzant els mètodes pandas.concat() i Unique().
  • Utilitzant Series.drop_duplicates()

Obteniu els valors únics de la columna 'B'.

En aquest exemple, estem recuperant i imprimint els valors únics de la columna 'B' mitjançant l' unique()> mètode. Els valors únics resultants són['B1', 'B2', 'B3', 'B4']>.

Python 3




# Import pandas package> import> pandas as pd> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)> # Get the unique values of 'B' column> df.B.unique()>

mida de python
>

>

Sortida

array(['B1', 'B2', 'B3', 'B4'], dtype=object)>

Obteniu els valors únics dels pandes a la columna 'E'.

En aquest exemple, creem un DataFrame pandas a partir d'un diccionari i després recuperem els valors únics de la columna 'E' mitjançant elunique()>mètode. Els valors únics resultants són['E1']>.

Python 3




# Import pandas package> import> pandas as pd> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)> # Get the unique values of 'E' column> df.E.unique()>

>

>

Sortida

array(['E1'], dtype=object)>

Obteniu el nombre de valors únics en una columna

En aquest exemple, creem un DataFrame pandas a partir d'un diccionari i després calculem i imprimim el nombre de valors únics a la columna 'C', exclosos els valors de NaN. El resultat és 3, cosa que indica que hi ha tres valors únics a la columna 'C'.

Python 3


si més si més java



# Import pandas package> import> pandas as pd> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)> # Get number of unique values in column 'C'> df.C.nunique(dropna>=>True>)>

>

>

Sortida

3>

Elimineu els valors duplicats d'una columna mitjançant set()

En aquest exemple, creem un DataFrame pandas a partir d'un diccionari i després fem servir el set()>funció per extreure valors únics de la columna 'C', eliminant els duplicats. El conjunt resultant,{'C1', 'C2', 'C3'}>, representa els valors únics de la columna 'C'.

Python 3




# Import pandas package> import> pandas as pd> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)> # Use set() to eliminate duplicate values in column 'C'> unique_values_set>=> set>(df[>'C'>])> # Print the unique values> print>(unique_values_set)>

>

>

Sortida

{'C1', 'C2', 'C3'}>

Utilitzant els mètodes pandas.concat() i Unique().

En aquest exemple, creem un Pandas DataFrame a partir d'un diccionari i després concatenem valors únics de totes les columnes mitjançant pd.concat()> . La matriu NumPy resultant, quan s'imprimeix, mostra tots els valors únics de les columnes 'A' a 'E'.

java està buit

Python 3




# Import pandas package> import> pandas as pd> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)> # Use pd.concat() to concatenate all columns and then apply unique()> unique_values_all_columns>=> pd.concat([df[col].unique()>for> col>in> df.columns])> # Print the unique values> print>(unique_values_all_columns)>

>

>

Sortida

['A1' 'A2' 'A3' 'A4' 'A5' 'B1' 'B2' 'B3' 'B4' 'C1' 'C2' 'C3' 'D1' 'D2' 'E1']>

Utilitzant Series.drop_duplicates()

En aquest exemple, creem un DataFrame pandas a partir d'un diccionari i eliminem els duplicats de les columnes 'A' i 'D' mitjançant el drop_duplicates()>mètode . El DataFrame resultant, quan s'imprimeix, mostra els valors únics a les columnes 'A' i 'D', amb valors de NaN on es van eliminar els duplicats de 'D'.

Python 3




# Import pandas package> import> pandas as pd> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)> # Use drop_duplicates() to remove duplicates from columns 'A' and 'D'> df[>'A'>]>=> df[>'A'>].drop_duplicates()> df[>'D'>]>=> df[>'D'>].drop_duplicates()> # Print the DataFrame after removing duplicates from columns 'A' and 'D'> print>(df)>

>

convertir nombre enter en cadena java

>

Sortida

   A B C D E   0 A1 B1 C1 D1 E1 1 A2 B2 C2 D2 E1 2 A3 B3 C3 NaN E1 3 A4 B4 C3 NaN E1 4 A5 B4 C3 NaN E1>