La biblioteca Pandas de Python és molt útil per a la manipulació de dades matemàtiques i s'utilitza àmpliament en el camp de l'aprenentatge automàtic. Comprèn molts mètodes per al seu bon funcionament. lloc () i iloc() són un d'aquests mètodes. S'utilitzen per tallar les dades de l' Pandas DataFrame . Ajuden a la selecció còmoda de dades del DataFrame a Python . S'utilitzen per filtrar les dades segons algunes condicions.
Diferència entre loc() i iloc() a Pandas DataFrame
Aquí, veurem la diferència entre la funció loc() i iloc() a Pandas DataFrame. Per veure i comparar la diferència entre aquests dos, crearem un Dataframe de mostra que utilitzarem en tot el paràgraf. El funcionament d'aquests dos mètodes s'explica al conjunt de dades de mostra dels cotxes.
python3
negació matemàtica discreta
# importing the module> import> pandas as pd> > # creating a sample dataframe> data>=> pd.DataFrame({>'Brand'>: [>'Maruti'>,>'Hyundai'>,>'Tata'>,> >'Mahindra'>,>'Maruti'>,>'Hyundai'>,> >'Renault'>,>'Tata'>,>'Maruti'>],> >'Year'>: [>2012>,>2014>,>2011>,>2015>,>2012>,> >2016>,>2014>,>2018>,>2019>],> >'Kms Driven'>: [>50000>,>30000>,>60000>,> >25000>,>10000>,>46000>,> >31000>,>15000>,>12000>],> >'City'>: [>'Gurgaon'>,>'Delhi'>,>'Mumbai'>,> >'Delhi'>,>'Mumbai'>,>'Delhi'>,> >'Mumbai'>,>'Chennai'>,>'Ghaziabad'>],> >'Mileage'>: [>28>,>27>,>25>,>26>,>28>,> >29>,>24>,>21>,>24>]})> > # displaying the DataFrame> display(data)> |
>
>
Sortida
Brand Year Kms Driven City Mileage 0 Maruti 2012 50000 Gurgaon 28 1 Hyundai 2014 30000 Delhi 27 2 Tata 2011 60000 Mumbai 25 3 Mahindra 2015 25000 Delhi 26 4 Maruti 2012 10000 Mumbai 28 5 Hyundai 2016 46000 Delhi 29 6 Renault 2014 31000 Mumbai 24 7 Tata 2018 15000 Chennai 21 8 Maruti 2019 12000 Ghaziabad 24>
Funció loc() de Python
El funció loc(). és un mètode de selecció de dades basat en etiquetes, el que significa que hem de passar el nom de la fila o columna que volem seleccionar. Aquest mètode inclou l'últim element de l'interval passat, a diferència d'iloc(). loc() pot acceptar les dades booleanes a diferència d'iloc(). Es poden realitzar moltes operacions utilitzant el mètode loc() com
Exemple 1: Selecció de dades segons algunes condicions
En aquest exemple, el codi utilitzaloc>funció per seleccionar i mostrar files del DataFrame on la marca és 'Maruti' i el quilometratge és superior a 25, mostrant informació rellevant sobre els cotxes Maruti amb un gran quilometratge.
python3
# selecting cars with brand 'Maruti' and Mileage>25> display(data.loc[(data.Brand>=>=> 'Maruti'>) & (data.Mileage>>25>)])> |
>
>
Sortida
Brand Year Kms Driven City Mileage 0 Maruti 2012 50000 Gurgaon 28 4 Maruti 2012 10000 Mumbai 28>
Exemple 2: Selecció d'un rang de files del DataFrame
En aquest exemple, el codi utilitza elloc>funció per extreure i mostrar files amb índexs que van del 2 al 5 (inclosos) del DataFrame, proporcionant informació sobre una gamma específica de cotxes del conjunt de dades.
números bloquejats
python3
ordres de Linux que
# selecting range of rows from 2 to 5> display(data.loc[>2>:>5>])> |
>
>
Sortida
Brand Year Kms Driven City Mileage 2 Tata 2011 60000 Mumbai 25 3 Mahindra 2015 25000 Delhi 26 4 Maruti 2012 10000 Mumbai 28 5 Hyundai 2016 46000 Delhi 29>
Exemple 3: Actualització del valor de qualsevol columna
En aquest exemple, el codi utilitzaloc>funció per actualitzar els valors 'Mileage' a 22 per als cotxes del DataFrame on l'any de fabricació és anterior al 2015. A continuació, es mostra el DataFrame modificat, que reflecteix els canvis fets a la columna Mileage.
python3
# updating values of Mileage if Year <2015> data.loc[(data.Year <>2015>), [>'Mileage'>]]>=> 22> display(data)> |
>
programació cobol
>
Sortida
Brand Year Kms Driven City Mileage 0 Maruti 2012 50000 Gurgaon 22 1 Hyundai 2014 30000 Delhi 22 2 Tata 2011 60000 Mumbai 22 3 Mahindra 2015 25000 Delhi 26 4 Maruti 2012 10000 Mumbai 22 5 Hyundai 2016 46000 Delhi 29 6 Renault 2014 31000 Mumbai 22 7 Tata 2018 15000 Chennai 21 8 Maruti 2019 12000 Ghaziabad 24>
Funció Python iloc().
El funció iloc(). és un mètode de selecció basat en indexació, el que significa que hem de passar un índex sencer al mètode per seleccionar una fila/columna específica. Aquest mètode no inclou l'últim element de l'interval passat a diferència de loc(). iloc() no accepta les dades booleanes a diferència de loc(). Les operacions realitzades amb iloc() són:
Exemple 1: Selecció de files amb índexs enters
En aquest exemple, el codi utilitza eliloc>funció per extreure i mostrar files específiques amb índexs 0, 2, 4 i 7 del DataFrame, mostrant informació sobre els cotxes seleccionats al conjunt de dades.
python3
# selecting 0th, 2nd, 4th, and 7th index rows> display(data.iloc[[>0>,>2>,>4>,>7>]])> |
>
>
Sortida
Brand Year Kms Driven City Mileage 0 Maruti 2012 50000 Gurgaon 28 2 Tata 2011 60000 Mumbai 25 4 Maruti 2012 10000 Mumbai 28 7 Tata 2018 15000 Chennai 21>
Exemple 2: Seleccionar un rang de columnes i files simultàniament
En aquest exemple, el codi utilitza eliloc>funció per extreure i mostrar un subconjunt del DataFrame, incloses les files de l'1 a la 4 i les columnes de la 2 a la 4. Això proporciona informació sobre una gamma específica de cotxes i els seus atributs rellevants al conjunt de dades.
python3
# selecting rows from 1 to 4 and columns from 2 to 4> display(data.iloc[>1>:>5>,>2>:>5>])> |
>
topologies
>
Sortida
Kms Driven City Mileage 1 30000 Delhi 27 2 60000 Mumbai 25 3 25000 Delhi 26 4 10000 Mumbai 28>