logo

Pandas DataFrame.describe()

El mètode describe() s'utilitza per calcular algunes dades estadístiques com percentil, mitjana i std dels valors numèrics de la sèrie o DataFrame. Analitza sèries tant numèriques com d'objectes i també els conjunts de columnes DataFrame de tipus de dades mixtes.

Sintaxi

 DataFrame.describe(percentiles=None, include=None, exclude=None) 

Paràmetres

    percentil:És un paràmetre opcional que és una llista com el tipus de dades de nombres que haurien d'estar entre 0 i 1. El seu valor per defecte és [.25, .5, .75], que retorna els percentils 25, 50 i 75.incloure:També és un paràmetre opcional que inclou la llista dels tipus de dades mentre es descriu el DataFrame. El seu valor predeterminat és Cap.excloure:També és un paràmetre opcional que exclou la llista de tipus de dades mentre es descriu DataFrame. El seu valor predeterminat és Cap.

Devolucions

Retorna el resum estadístic de la sèrie i el DataFrame.

Exemple 1

 import pandas as pd import numpy as np a1 = pd.Series([1, 2, 3]) a1.describe() 

Sortida

jsp javatpoint
 count 3.0 mean 2.0 std 1.0 min 1.0 25% 1.5 50% 2.0 75% 2.5 max 3.0 dtype: float64 

Exemple 2

 import pandas as pd import numpy as np a1 = pd.Series(['p', 'q', 'q', 'r']) a1.describe() 

Sortida

arquitectura de von neumann
 count 4 unique 3 top q freq 2 dtype: object 

Exemple 3

 import pandas as pd import numpy as np a1 = pd.Series([1, 2, 3]) a1.describe() a1 = pd.Series(['p', 'q', 'q', 'r']) a1.describe() info = pd.DataFrame({'categorical': pd.Categorical(['s','t','u']), 'numeric': [1, 2, 3], 'object': ['p', 'q', 'r'] }) info.describe(include=[np.number]) info.describe(include=[np.object]) info.describe(include=['category']) 

Sortida

 categorical count 3 unique 3 top u freq 1 

Exemple 4

 import pandas as pd import numpy as np a1 = pd.Series([1, 2, 3]) a1.describe() a1 = pd.Series(['p', 'q', 'q', 'r']) a1.describe() info = pd.DataFrame({'categorical': pd.Categorical(['s','t','u']), 'numeric': [1, 2, 3], 'object': ['p', 'q', 'r'] }) info.describe() info.describe(include='all') info.numeric.describe() info.describe(include=[np.number]) info.describe(include=[np.object]) info.describe(include=['category']) info.describe(exclude=[np.number]) info.describe(exclude=[np.object]) 

Sortida

 categorical numeric count 3 3.0 unique 3 NaN top u NaN freq 1 NaN mean NaN 2.0 std NaN 1.0 min NaN 1.0 25% NaN 1.5 50% NaN 2.0 75% NaN 2.5 max NaN 3.0