logo

Dades nominals vs ordinals

La ciència de dades gira al voltant del processament i anàlisi de dades utilitzant una sèrie d'eines i tècniques. En el món actual basat en dades, ens trobem amb tipus de dades que requereixen manipulació i interpretació. És important entendre diferents tipus de dades per a una correcta anàlisi de dades i interpretació estadística. El tipus de dades determina els mètodes estadístics adequats i les operacions que s'han d'utilitzar. Diversos tipus de dades necessiten diferents mètodes d'anàlisi i interpretació per treure conclusions significatives. En aquest article explorarem el concepte de dades i la seva importància proporcionarem exemples del món real i us guiarem per les maneres de treballar-hi.

Nivells de mesura

Abans d'analitzar un conjunt de dades, és crucial identificar el tipus de dades que conté. Afortunadament, totes les dades es poden agrupar en una d'aquestes quatre categories: dades nominals, ordinals, d'interval o de relació. Tot i que sovint es coneixen com a tipus de dades, en realitat són diferents nivells de mesura. El nivell de mesura reflecteix la precisió amb què s'ha quantificat una variable i determina els mètodes que es poden utilitzar per extreure informació de les dades.



Les quatre categories de dades no sempre són senzilles de distingir i, en canvi, pertanyen a una jerarquia, amb cada nivell basat en l'anterior.

1

Hi ha quatre tipus de dades: categòriques, que es poden dividir en nominals i ordinals, i numèriques, que es poden dividir en interval i raó. Les escales nominals i ordinals són relativament imprecises, cosa que les fa més fàcils d'analitzar, però ofereixen una visió menys precisa. D'altra banda, les escales d'interval i proporció són més complexes i difícils d'analitzar, però tenen el potencial de proporcionar una visió molt més rica.



  • Dades nominals – Les dades nominals són un tipus de dades bàsic que categoritza les dades etiquetant o anomenant valors com ara el gènere, el color del cabell o els tipus d'animals. No té cap jerarquia.
  • Dades Ordinals – Les dades ordinals impliquen classificar les dades en funció del rang, com ara l'estatus social en categories com 'rics', 'ingressos mitjans' o 'pobres'. Tanmateix, no hi ha intervals establerts entre aquestes categories.
  • Dades d'interval – Les dades d'interval és una manera d'organitzar i comparar dades que inclou intervals mesurats. Les escales de temperatura, com Celsius o Fahrenheit, són bons exemples de dades d'interval. Tanmateix, les dades d'interval no tenen un zero real, el que significa que una mesura de zero encara pot representar una mesura quantificable (com ara zero graus centígrads, que és només un punt més a l'escala i no vol dir que no hi hagi temperatura present) .
  • Dades de ràtio – El nivell de mesura més complicat són les dades de relació. De manera similar a les dades d'interval, classifica i organitza les dades utilitzant intervals mesurats. Però, a diferència de les dades d'interval, les dades de proporció inclouen un zero genuí. Quan una variable és zero, no hi ha presència d'aquesta variable. Una il·lustració principal de les dades de relació és la mesura de l'alçada, que no pot ser negativa.

Què són les dades nominals?

Les dades categòriques, també conegudes com a dades nominals, són un tipus d'informació crucial que s'utilitza en diversos camps com ara la investigació, les estadístiques i l'anàlisi de dades. Es compon de categories o etiquetes que ajuden a classificar i organitzar les dades. La característica essencial de les dades categòriques és que no posseeixen cap ordre o classificació inherent entre les seves categories. En canvi, aquestes categories són separades, diferents i mútuament excloents.

2

Per exemple, les dades nominals s'utilitzen per classificar la informació en etiquetes o categories diferents sense cap ordre o classificació natural. Aquestes etiquetes o categories es representen mitjançant noms o termes, i no hi ha cap ordre natural ni classificació entre ells. Les dades nominals són útils per a la classificació qualitativa i l'organització de la informació, permetent als investigadors i analistes agrupar punts de dades en funció d'atributs o característiques específiques sense implicar cap relació numèrica.



  • Les categories de color dels ulls com el blau o el verd representen dades nominals. Cada categoria és diferent, sense ordre ni classificació.
  • Les marques de telèfons intel·ligents com iPhone o Samsung són dades nominals. No hi ha jerarquia entre marques.
  • Els modes de transport com el cotxe o la bicicleta són dades nominals. Són categories discretes sense ordre inherent.

Característiques de les dades nominals

  • Les dades que es classifiquen com a nominals estan formades per categories completament separades i diferents les unes de les altres.
  • Les dades que pertanyen a la categoria nominal es distingeixen per etiquetes descriptives en lloc de qualsevol valor numèric o quantitatiu
  • Les dades nominals no es poden classificar ni ordenar jeràrquicament, ja que cap categoria és superior o inferior a una altra.

Exemple

Aquests són alguns exemples de com s'utilitzen les dades nominals per classificar i categoritzar la informació en categories diferents i no ordenades:

1. Colors del cotxe: Els colors dels cotxes són dades nominals, amb categories clares però sense ordre ni classificació inherent. Cada cotxe pertany a una categoria de color, sense cap connexió lògica o numèrica entre els colors.

2. Tipus de fruites: Les categories de fruites d'una cistella són nominals. Cada fruita pertany a una categoria específica sense jerarquia ni ordre. Totes les categories són diferents i discretes.

3. Gèneres de pel·lícules: Els gèneres de pel·lícules són dades nominals, ja que no hi ha cap classificació entre categories com ara acció o comèdia. Cada gènere és únic, però no podem dir si un és millor que un altre només a partir d'aquestes dades.

Què són les dades ordinals?

Les dades ordinals són una forma de dades qualitatives que classifica les variables en categories descriptives. Es caracteritza pel fet que les categories que empra es classifiquen en algun tipus d'escala jeràrquica, com ara d'alt a baix. Les dades ordinals són el segon tipus de mesura més complicat, després de les nominals. Tot i que és més complexa que les dades nominals, que no tenen cap ordre inherent, encara és relativament simplista.

3

Per exemple, les dades ordinals són un tipus de dades que s'utilitzen per categoritzar elements amb una jerarquia o un ordre significatius. Aquestes categories ens ajuden a comparar i classificar diferents assoliments, posicions o rendiment dels estudiants, encara que els intervals entre ells no siguin iguals. Les dades ordinals són útils per entendre les opcions o preferències ordenades i per avaluar les diferències relatives.

  • Qualificacions escolars: les qualificacions com A, B, C són dades ordinals, classificades per rendiment, però els intervals entre elles varien.
  • Nivell educatiu: nivells com el batxillerat, el batxillerat i el màster són dades ordinals, ordenades per educació, però les llacunes entre nivells són diferents.
  • Nivell d'antiguitat: els nivells de feina com l'entrada, el mitjà i el sènior són dades ordinals, que indiquen la jerarquia, però la bretxa varia segons la feina i la indústria.

Característiques de les dades ordinals

  • Les dades ordinals pertanyen a la categoria de dades no numèriques i categòriques, però encara poden utilitzar valors numèrics com a etiquetes.
  • Les dades ordinals sempre es classifiquen en una jerarquia (d'aquí el nom 'ordinal').
  • Les dades ordinals es poden classificar, però els seus valors no es distribueixen uniformement.
  • Amb les dades ordinals, podeu calcular la distribució de freqüències, el mode, la mediana i el rang de variables.

Exemple

A continuació es mostren alguns exemples de com s'utilitzen les dades ordinals en camps i dominis:

1. Nivells educatius: Les dades ordinals s'utilitzen habitualment per representar nivells educatius, com ara escola, grau, màster i doctorat. Aquests nivells tenen un ordre.

2. Valoracions de satisfacció del client: Una altra aplicació de les dades és en les enquestes de satisfacció del client. Aquestes enquestes sovint demanen als enquestats que valoren la seva experiència en una escala, de pobre a excel·lent.

3. Classes econòmiques: les classes que inclouen la classe mitjana i la classe alta es poden classificar com a dades ordinals en funció de la seva classificació.

Aquests exemples demostren les maneres en què s'utilitzen les dades ordinals en camps i dominis.

Dades nominals vs ordinàries

Característiques

Dades nominals

Dades Ordinals

Naturalesa de les categories

Distint i discret

Discret i diferent

Ordre/Rànquing

Cap ordre inherent

Té un ordre o una classificació clars

Valors numèrics

No hi ha valors numèrics significatius

No hi ha valors numèrics significatius

Tècniques d'anàlisi

Recomptes de freqüència, percentatges, gràfics de barres

Classificació, mediana, proves no paramètriques, gràfics de barres ordenats, regressió ordinal

Exemple

Colors, gènere, tipus d'animals

np.random.rand

Graus escolars, nivell d'estudis, nivell d'antiguitat

Interpretació

S'utilitza per classificar i agrupar en funció de la categoria

S'utilitza per avaluar les preferències ordenades, la jerarquia o els rànquings