Filtrar un Pandas DataFrame mitjançant valors de columna és una operació habitual mentre s'executa amb informació a Python. Podeu utilitzar diferents mètodes i tècniques per aconseguir-ho. Aquí hi ha nombroses maneres de filtrar un Pandas DataFrame mitjançant valors de columna.
En aquesta publicació, veurem diferents maneres de filtrar Pandas Dataframe per valors de columna. Primer, creem un Dataframe:
Python 3
# importing pandas> import> pandas as pd> > # declare a dictionary> record>=> {> >'Name'> : [>'Ankit'>,>'Swapnil'>,>'Aishwarya'>,> >'Priyanka'>,>'Shivangi'>,>'Shaurya'> ],> > >'Age'> : [>22>,>20>,>21>,>19>,>18>,>22>],> > >'Stream'> : [>'Math'>,>'Commerce'>,>'Science'>,> >'Math'>,>'Math'>,>'Science'>],> > >'Percentage'> : [>90>,>90>,>96>,>75>,>70>,>80>] }> > # create a dataframe> dataframe>=> pd.DataFrame(record,> >columns>=> [>'Name'>,>'Age'>,> >'Stream'>,>'Percentage'>])> # show the Dataframe> print>(>'Given Dataframe :
'>, dataframe)> |
>
>
Sortida:

Seleccionar files de Pandas Dataframe en funció d'un valor de columna particular mitjançant l'operador '>', '=', '=', '<=', '!='.
Exemple 1: Seleccioneu totes les files del marc de dades donat en què el 'Percentatge' sigui superior a 75 utilitzant [ ] .
Python 3
# selecting rows based on condition> rslt_df>=> dataframe[dataframe[>'Percentage'>]>>70>]> > print>(>'
Result dataframe :
'>, rslt_df)> |
>
>
Sortida:

Exemple 2: Seleccioneu totes les files del Dataframe donat en què el 'Percentatge' sigui superior a 70 utilitzant lloc [ ] .
Python 3
# selecting rows based on condition> rslt_df>=> dataframe.loc[dataframe[>'Percentage'>]>>70>]> > print>(>'
Result dataframe :
'>,> >rslt_df)> |
>
>
Sortida:

Seleccioneu les files de Pandas Dataframe el valor de la columna de les quals està present a la llista utilitzant vostè() mètode del marc de dades.
Exemple 1: Seleccioneu totes les files del marc de dades donat en què 'Stream' està present a la llista d'opcions utilitzant [ ] .
Python 3
options>=> [>'Science'>,>'Commerce'>]> > # selecting rows based on condition> rslt_df>=> dataframe[dataframe[>'Stream'>].isin(options)]> > print>(>'
Result dataframe :
'>,> >rslt_df)> |
>
>
Sortida:

Exemple 2: Seleccioneu totes les files del marc de dades donat en què 'Stream' està present a la llista d'opcions utilitzant lloc [ ] .
Python
options>=> [>'Science'>,>'Commerce'>]> > # selecting rows based on condition> rslt_df>=> dataframe.loc[dataframe[>'Stream'>].isin(options)]> > print>(>'
Result dataframe :
'>,> >rslt_df)> |
>
>
Sortida:

Selecció de files de Pandas Dataframe en funció de les condicions de diverses columnes mitjançant l'operador '&'.
Exemple 1: Seleccioneu totes les files del marc de dades donat en què 'Edat' és igual a 22 i 'Flux' està present a la llista d'opcions mitjançant [ ] .
Python 3
options>=> [>'Commerce'> ,>'Science'>]> > # selecting rows based on condition> rslt_df>=> dataframe[(dataframe[>'Age'>]>=>=> 22>) &> >dataframe[>'Stream'>].isin(options)]> > print>(>'
Result dataframe :
'>,> >rslt_df)> |
>
>
Sortida:

Exemple 2: Seleccioneu totes les files del marc de dades donat en què 'Edat' és igual a 22 i 'Flux' està present a la llista d'opcions mitjançant lloc [ ] .
Python 3
una forma completa
options>=> [>'Commerce'>,>'Science'>]> > # selecting rows based on condition> rslt_df>=> dataframe.loc[(dataframe[>'Age'>]>=>=> 22>) &> >dataframe[>'Stream'>].isin(options)]> > print>(>'
Result dataframe :
'>,> >rslt_df)> |
>
>
Sortida:
