logo

Maneres de filtrar Pandas DataFrame per valors de columna

Filtrar un Pandas DataFrame mitjançant valors de columna és una operació habitual mentre s'executa amb informació a Python. Podeu utilitzar diferents mètodes i tècniques per aconseguir-ho. Aquí hi ha nombroses maneres de filtrar un Pandas DataFrame mitjançant valors de columna.

En aquesta publicació, veurem diferents maneres de filtrar Pandas Dataframe per valors de columna. Primer, creem un Dataframe:



Python 3








# importing pandas> import> pandas as pd> > # declare a dictionary> record>=> {> >'Name'> : [>'Ankit'>,>'Swapnil'>,>'Aishwarya'>,> >'Priyanka'>,>'Shivangi'>,>'Shaurya'> ],> > >'Age'> : [>22>,>20>,>21>,>19>,>18>,>22>],> > >'Stream'> : [>'Math'>,>'Commerce'>,>'Science'>,> >'Math'>,>'Math'>,>'Science'>],> > >'Percentage'> : [>90>,>90>,>96>,>75>,>70>,>80>] }> > # create a dataframe> dataframe>=> pd.DataFrame(record,> >columns>=> [>'Name'>,>'Age'>,> >'Stream'>,>'Percentage'>])> # show the Dataframe> print>(>'Given Dataframe : '>, dataframe)>

>

>

Sortida:

Marc de dades

Seleccionar files de Pandas Dataframe en funció d'un valor de columna particular mitjançant l'operador '>', '=', '=', '<=', '!='.

Exemple 1: Seleccioneu totes les files del marc de dades donat en què el 'Percentatge' sigui superior a 75 utilitzant [ ] .

Python 3




# selecting rows based on condition> rslt_df>=> dataframe[dataframe[>'Percentage'>]>>70>]> > print>(>' Result dataframe : '>, rslt_df)>

>

>

Sortida:

marc de dades de sortida

Exemple 2: Seleccioneu totes les files del Dataframe donat en què el 'Percentatge' sigui superior a 70 utilitzant lloc [ ] .

Python 3




# selecting rows based on condition> rslt_df>=> dataframe.loc[dataframe[>'Percentage'>]>>70>]> > print>(>' Result dataframe : '>,> >rslt_df)>

>

>

Sortida:

marc de dades de sortida-1

Seleccioneu les files de Pandas Dataframe el valor de la columna de les quals està present a la llista utilitzant vostè() mètode del marc de dades.

Exemple 1: Seleccioneu totes les files del marc de dades donat en què 'Stream' està present a la llista d'opcions utilitzant [ ] .

Python 3




options>=> [>'Science'>,>'Commerce'>]> > # selecting rows based on condition> rslt_df>=> dataframe[dataframe[>'Stream'>].isin(options)]> > print>(>' Result dataframe : '>,> >rslt_df)>

>

>

Sortida:

marc de dades de sortida-2

Exemple 2: Seleccioneu totes les files del marc de dades donat en què 'Stream' està present a la llista d'opcions utilitzant lloc [ ] .

Python




options>=> [>'Science'>,>'Commerce'>]> > # selecting rows based on condition> rslt_df>=> dataframe.loc[dataframe[>'Stream'>].isin(options)]> > print>(>' Result dataframe : '>,> >rslt_df)>

>

>

Sortida:

marc de dades de sortida-3

Selecció de files de Pandas Dataframe en funció de les condicions de diverses columnes mitjançant l'operador '&'.

Exemple 1: Seleccioneu totes les files del marc de dades donat en què 'Edat' és igual a 22 i 'Flux' està present a la llista d'opcions mitjançant [ ] .

Python 3




options>=> [>'Commerce'> ,>'Science'>]> > # selecting rows based on condition> rslt_df>=> dataframe[(dataframe[>'Age'>]>=>=> 22>) &> >dataframe[>'Stream'>].isin(options)]> > print>(>' Result dataframe : '>,> >rslt_df)>

>

>

Sortida:

marc de dades de sortida-4

Exemple 2: Seleccioneu totes les files del marc de dades donat en què 'Edat' és igual a 22 i 'Flux' està present a la llista d'opcions mitjançant lloc [ ] .

Python 3




una forma completa

options>=> [>'Commerce'>,>'Science'>]> > # selecting rows based on condition> rslt_df>=> dataframe.loc[(dataframe[>'Age'>]>=>=> 22>) &> >dataframe[>'Stream'>].isin(options)]> > print>(>' Result dataframe : '>,> >rslt_df)>

>

>

Sortida:

marc de dades de sortida-5