logo

Normalització

Una gran base de dades definida com una única relació pot donar lloc a la duplicació de dades. Aquesta repetició de dades pot donar lloc a:

  • Fer les relacions molt grans.
  • No és fàcil mantenir i actualitzar les dades, ja que implicaria cercar molts registres en relació.
  • Malbaratament i mala utilització de l'espai de disc i recursos.
  • La probabilitat d'errors i inconsistències augmenta.

Per tant, per gestionar aquests problemes, hauríem d'analitzar i descompondre les relacions amb dades redundants en relacions més petites, més simples i ben estructurades que compleixin les propietats desitjables. La normalització és un procés de descomposició de les relacions en relacions amb menys atributs.

Què és la normalització?

  • La normalització és el procés d'organització de les dades a la base de dades.
  • La normalització s'utilitza per minimitzar la redundància d'una relació o conjunt de relacions. També s'utilitza per eliminar característiques indesitjables com les anomalies d'inserció, actualització i supressió.
  • La normalització divideix la taula més gran en més petita i les enllaça mitjançant relacions.
  • La forma normal s'utilitza per reduir la redundància de la taula de base de dades.

Per què necessitem la normalització?

convertir un nombre enter en una cadena

El motiu principal per normalitzar les relacions és eliminar aquestes anomalies. La manca d'eliminació d'anomalies comporta la redundància de les dades i pot provocar la integritat de les dades i altres problemes a mesura que la base de dades creix. La normalització consisteix en una sèrie de pautes que us ajuden a guiar-vos per crear una bona estructura de base de dades.

Les anomalies de modificació de dades es poden classificar en tres tipus:

mètodes java
    Anomalia d'inserció:L'anomalia d'inserció es refereix a quan no es pot inserir una nova tupla en una relació per manca de dades.Anomalia d'eliminació:L'anomalia d'eliminació fa referència a la situació en què l'eliminació de dades provoca la pèrdua no desitjada d'altres dades importants.Anomalia d'actualització:L'anomalia d'actualització és quan una actualització d'un sol valor de dades requereix que s'actualitzin diverses files de dades.

Tipus de formes normals:

La normalització funciona mitjançant una sèrie d'etapes anomenades formes normals. Les formes normals s'apliquen a les relacions individuals. Es diu que la relació té una forma normal particular si satisfà les restriccions.

A continuació es mostren els diferents tipus de formes normals:

Normalització DBMS
Forma normal Descripció
1NF Una relació és en 1NF si conté un valor atòmic.
2NF Una relació estarà a 2NF si és a 1NF i tots els atributs que no són clau són totalment funcionals depenent de la clau primària.
3NF Una relació estarà a 3NF si és a 2NF i no hi ha cap dependència de transició.
BCNF Una definició més forta de 3NF es coneix com la forma normal de Boyce Codd.
4NF Una relació estarà en 4NF si està en la forma normal de Boyce Codd i no té cap dependència multivalor.
5NF Una relació és a 5NF. Si està a 4NF i no conté cap dependència d'unió, la unió hauria de ser sense pèrdues.

Avantatges de la normalització

  • La normalització ajuda a minimitzar la redundància de dades.
  • Major organització global de la base de dades.
  • Coherència de les dades dins de la base de dades.
  • Disseny de bases de dades molt més flexible.
  • Impulsa el concepte d'integritat relacional.

Inconvenients de la normalització

  • No podeu començar a construir la base de dades abans de saber què necessita l'usuari.
  • El rendiment es degrada quan es normalitzen les relacions amb formes normals superiors, és a dir, 4NF, 5NF.
  • És molt llarg i difícil normalitzar les relacions de grau superior.
  • La descomposició descuidada pot conduir a un mal disseny de la base de dades, que pot provocar problemes greus.