logo

Sèrie Python Pandas

La sèrie Pandas es pot definir com una matriu unidimensional que és capaç d'emmagatzemar diversos tipus de dades. Podem convertir fàcilment la llista, la tupla i el diccionari en sèries amb ' sèrie ' mètode. Les etiquetes de fila de la sèrie s'anomenen índex. Una sèrie no pot contenir diverses columnes. Té el següent paràmetre:

    dades:Pot ser qualsevol llista, diccionari o valor escalar.índex:El valor de l'índex ha de ser únic i hashable. Ha de tenir la mateixa longitud que les dades. Si no passem cap índex, per defecte np.arrange(n) serà utilitzat.dtype:Es refereix al tipus de dades de la sèrie.còpia:S'utilitza per copiar les dades.

Creació d'una sèrie:

Podem crear una sèrie de dues maneres:

  1. Crea una sèrie buida
  2. Crea una sèrie utilitzant entrades.

Crea una sèrie buida:

Podem crear fàcilment una sèrie buida a Pandas, la qual cosa significa que no tindrà cap valor.

js onload

La sintaxi que s'utilitza per crear una sèrie buida:

 = pandas.Series() 

L'exemple següent crea un objecte tipus Sèrie buida que no té valors i que té un tipus de dades predeterminat, és a dir, flotar64 .

Exemple

 import pandas as pd x = pd.Series() print (x) 

Sortida

 Series([], dtype: float64) 

Creació d'una sèrie amb entrades:

Podem crear sèries utilitzant diverses entrades:

  • Matriu
  • Dict
  • Valor escalar

Creació de sèries a partir de la matriu:

Abans de crear una sèrie, en primer lloc, hem d'importar el numpy mòdul i després utilitzeu la funció array() al programa. Si les dades són ndarray, l'índex passat ha de ser de la mateixa longitud.

Si no passem un índex, per defecte l'índex de rang (n) s'està passant on n defineix la longitud d'una matriu, és a dir, [0,1,2,.... rang (len (matriu)) -1 ].

Exemple

pendent indefinida
 import pandas as pd import numpy as np info = np.array(['P','a','n','d','a','s']) a = pd.Series(info) print(a) 

Sortida

 0 P 1 a 2 n 3 d 4 a 5 s dtype: object 

Crea una sèrie a partir de dict

També podem crear una sèrie a partir de dict. Si l'objecte del diccionari s'està passant com a entrada i l'índex no s'especifica, les claus del diccionari es prenen en un ordre ordenat per construir l'índex. .

Si es passa l'índex, els valors corresponen a una etiqueta concreta de l'índex s'extreuran de l'índex diccionari .

 #import the pandas library import pandas as pd import numpy as np info = {'x' : 0., 'y' : 1., 'z' : 2.} a = pd.Series(info) print (a) 

Sortida

 x 0.0 y 1.0 z 2.0 dtype: float64 

Creeu una sèrie amb Scalar:

Si prenem els valors escalars, s'ha de proporcionar l'índex. El valor escalar es repetirà per fer coincidir la longitud de l'índex.

 #import pandas library import pandas as pd import numpy as np x = pd.Series(4, index=[0, 1, 2, 3]) print (x) 

Sortida

 0 4 1 4 2 4 3 4 dtype: int64 

Accés a dades de sèries amb Posició:

Un cop hàgiu creat l'objecte de tipus Sèrie, podeu accedir als seus índexs, dades i fins i tot elements individuals.

Oracle sql no és igual

Es pot accedir a les dades de la sèrie de manera similar a la del ndarray.

 import pandas as pd x = pd.Series([1,2,3],index = ['a','b','c']) #retrieve the first element print (x[0]) 

Sortida

 1 

Atributs d'objectes de sèrie

L'atribut Sèrie es defineix com qualsevol informació relacionada amb l'objecte Sèrie, com ara la mida, el tipus de dades. etc. A continuació es mostren alguns dels atributs que podeu utilitzar per obtenir informació sobre l'objecte Sèrie:

Atributs Descripció
Sèrie.índex Defineix l'índex de la Sèrie.
sèrie.forma Retorna una tupla de forma de les dades.
Sèrie.dtype Retorna el tipus de dades de les dades.
mida.sèrie Retorna la mida de les dades.
Sèrie.buit Retorna True si l'objecte Series està buit, en cas contrari retorna false.
Sèrie.hasnans Retorna True si hi ha valors NaN, en cas contrari retorna fals.
Sèrie.nbytes Retorna el nombre de bytes de les dades.
Sèrie Retorna el nombre de dimensions de les dades.
Sèrie.mida.element Retorna la mida del tipus de dades de l'element.

Recuperació de matriu d'índex i matriu de dades d'un objecte de sèrie

Podem recuperar la matriu d'índex i la matriu de dades d'un objecte Sèrie existent utilitzant els atributs índex i valors.

 import numpy as np import pandas as pd x=pd.Series(data=[2,4,6,8]) y=pd.Series(data=[11.2,18.6,22.5], index=['a','b','c']) print(x.index) print(x.values) print(y.index) print(y.values) 

Sortida

 RangeIndex(start=0, stop=4, step=1) [2 4 6 8] Index(['a', 'b', 'c'], dtype='object') [11.2 18.6 22.5] 

Recuperació de tipus (dtype) i mida del tipus (itemsize)

Podeu utilitzar l'atribut dtype amb l'objecte Series com a dtype per recuperar el tipus de dades d'un element individual d'un objecte de sèrie, podeu utilitzar el mida dels elements atribut per mostrar el nombre de bytes assignats a cada element de dades.

 import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6], index=['x','y','z']) print(a.dtype) print(a.itemsize) print(b.dtype) print(b.itemsize) 

Sortida

què és un personatge especial
 int64 8 float64 8 

Recuperant forma

La forma de l'objecte Sèrie defineix el nombre total d'elements, inclosos els valors buits o que falten (NaN).

 import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6],index=['x','y','z']) print(a.shape) print(b.shape) 

Sortida

 (4,) (3,) 

Recuperació de la dimensió, la mida i el nombre de bytes:

 import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6], index=['x','y','z']) print(a.ndim, b.ndim) print(a.size, b.size) print(a.nbytes, b.nbytes) 

Sortida

 1 1 4 3 32 24 

Comprovació del buit i la presència de NaNs

Per comprovar que l'objecte Sèrie està buit, podeu utilitzar el atribut buit . De la mateixa manera, per comprovar si un objecte de sèrie conté alguns valors de NaN o no, podeu utilitzar el Hassan atribut.

preguntes bàsiques de l'entrevista de Java

Exemple

 import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,np.NaN]) b=pd.Series(data=[4.9,8.2,5.6],index=['x','y','z']) c=pd.Series() print(a.empty,b.empty,c.empty) print(a.hasnans,b.hasnans,c.hasnans) print(len(a),len(b)) print(a.count( ),b.count( )) 

Sortida

 False False True True False False 4 3 3 3 

Funcions de sèrie

Hi ha algunes funcions que s'utilitzen a la sèrie que són les següents:

Funcions Descripció
Pandas Series.map() Assigna els valors de dues sèries que tenen una columna comuna.
Pandas Series.std() Calcula la desviació estàndard del conjunt de nombres, DataFrame, columnes i files donat.
Pandas Series.to_frame() Converteix l'objecte de la sèrie al marc de dades.
Pandas Series.value_counts() Retorna una sèrie que conté recomptes de valors únics.