En aquest article, parlarem de com podem crear un trama de recompte utilitzant la biblioteca seaborn i com es poden utilitzar els diferents paràmetres per inferir resultats a partir de les característiques del nostre conjunt de dades.
Biblioteca Seaborn
La biblioteca seaborn s'utilitza àmpliament entre els analistes de dades, la galàxia de trames que conté proporciona la millor representació possible de les nostres dades.
La biblioteca seaborn es pot importar al nostre entorn de treball utilitzant-
import seaborn as sns
Anem a discutir ara per què utilitzem countplot i quina és la importància dels seus paràmetres.
Trama de recompte
El countplot s'utilitza per representar l'ocurrència (recomptes) de l'observació present a la variable categòrica.
Utilitza el concepte d'un gràfic de barres per a la representació visual.
paràmetres-
Els paràmetres següents s'especifiquen quan creem un countplot, fem-ne una breu idea:
matriu afegint elements java
Vegem ara quines són les diferents maneres de representar els nostres atributs.
En el primer exemple, crearem un countplot per a una sola variable. Hem pres el conjunt de dades 'consells' per implementar el mateix.
1. El valor compta per a una sola variable
Exemple -
import matplotlib.pyplot as plt import seaborn as sns import pandas as pd #loading the dataset 'tips' df=pd.read_csv('/content/tips.csv') #plotting the graph sns.countplot(x='sex',data=df) plt.show()
Sortida:
En el següent exemple, utilitzarem el paràmetre hue i crearem un countplot.
El programa següent il·lustra el mateix:
2. Representació de dues variables categòriques mitjançant el paràmetre hue
Exemple -
import matplotlib.pyplot as plt import seaborn as sns import pandas as pd #loading the dataset 'tips' df=pd.read_csv('/content/tips.csv') #plotting the graph sns.countplot(x='sex',hue='smoker',data=df) plt.show()
Sortida:
En el següent exemple, considerarem l'eix y i crearem un diagrama de recompte horitzontal.
El programa següent il·lustra el mateix:
3. Creació de trames horitzontals
Exemple -
cadena java a booleà
import matplotlib.pyplot as plt import seaborn as sns import pandas as pd #loading the dataset 'tips' df=pd.read_csv('/content/tips.csv') #plotting the graph sns.countplot(y='sex',hue='smoker',data=df) plt.show()
Sortida:
Fem ara una ullada a com les paletes de colors poden millorar la presentació de les nostres dades.
En el següent exemple, utilitzarem el paràmetre 'palette'.
El programa següent il·lustra el mateix:
4. Ús de paletes de colors
entrada-
import matplotlib.pyplot as plt import seaborn as sns import pandas as pd #loading the dataset 'tips' df=pd.read_csv('/content/tips.csv') #plotting the graph sns.countplot(x='sex', data=df, palette='Set1') plt.show()
Sortida:
En el següent exemple, utilitzarem el paràmetre color i veurem com funciona?
El programa següent il·lustra el mateix:
5. Ús d'un paràmetre 'color'
Exemple -
import matplotlib.pyplot as plt import seaborn as sns import pandas as pd #loading the dataset 'train' df=pd.read_csv('/content/train.csv') #plotting the graph sns.countplot(x='Pclass',hue='Sex', data=df, color='green') plt.show()
Sortida:
Ara utilitzarem el paràmetre 'saturació' i veurem com afecta la representació de les nostres dades.
El programa següent il·lustra el mateix:
6. Ús del paràmetre 'saturació'
Exemple -
import matplotlib.pyplot as plt import seaborn as sns import pandas as pd #loading the dataset 'train' df=pd.read_csv('/content/train.csv') #plotting the graph sns.countplot(x='Pclass',data=df, color='green', saturation=0.1) plt.show()
Sortida:
I finalment en l'últim exemple farem servir els paràmetres amplada de línia i color de la vora.
Exemple -
import matplotlib.pyplot as plt import seaborn as sns import pandas as pd #loading the dataset 'train' df=pd.read_csv('/content/train.csv') sns.countplot(x='Sex', data=df, color='green', facecolor=(0,0,0,0), linewidth=5, edgecolor=sns.color_palette('BrBG',2)) plt.show()
Sortida: