Una base de dades consta d'una gran quantitat de dades. Les dades s'agrupen dins d'una taula en RDBMS, i cada taula té registres relacionats. Un usuari pot veure que les dades s'emmagatzemen en forma de taules, però en realitat, aquesta enorme quantitat de dades s'emmagatzemen a la memòria física en forma de fitxers.
Què és a Dossier?
Un fitxer s'anomena una col·lecció d'informació relacionada que s'enregistra a l'emmagatzematge secundari, com ara discos magnètics , cintes magnètiques, i discos òptics .
Què és l'organització de fitxers?
L'organització del fitxer fa referència a les relacions lògiques entre diversos registres que constitueixen el fitxer, especialment pel que fa als mitjans d'identificació i accés a qualsevol registre específic. En termes simples, emmagatzemar els fitxers en un ordre determinat s'anomena Organització de fitxers. Estructura del fitxer fa referència al format de l'etiqueta i dels blocs de dades i de qualsevol registre de control lògic.
L'objectiu de l'organització dels fitxers
- Ajuda a la selecció més ràpida de registres, és a dir, fa que el procés sigui més ràpid.
- Les diferents operacions com inserir, suprimir i actualitzar diferents registres són més ràpides i fàcils.
- Ens impedeix inserir registres duplicats mitjançant diverses operacions.
- Ajuda a emmagatzemar els registres o les dades de manera molt eficient a un cost mínim
Tipus d'organitzacions de fitxers
S'han introduït diversos mètodes per organitzar fitxers. Aquests mètodes particulars tenen avantatges i desavantatges segons l'accés o la selecció. Per tant, correspon al programador decidir el mètode d'organització de fitxers més adequat segons els seus requisits.
Alguns tipus d'organitzacions de fitxers són:
- Organització de fitxers seqüencials
- Organització de fitxers Heap
- Organització de fitxers hash
- Organització de fitxers d'arbre B+
- Organització de fitxers en clúster
- ISAM (Mètode d'accés seqüencial indexat)
Parlarem de cadascuna de les organitzacions de fitxers en conjunts posteriors d'aquest article juntament amb les diferències i avantatges/desavantatges de cada mètode d'organització de fitxers.
Organització de fitxers seqüencials
El mètode més fàcil per organitzar fitxers és el mètode seqüencial. En aquest mètode, el fitxer s'emmagatzema un darrere l'altre de manera seqüencial. Hi ha dues maneres d'implementar aquest mètode:
1. Mètode d'arxiu de pila
Aquest mètode és bastant senzill, en el qual emmagatzemem els registres en una seqüència, és a dir, un darrere l'altre en l'ordre en què s'insereixen a les taules.
java converteix nombre enter en cadena
Mètode de fitxer de pila
Inserció del nou disc: Deixeu que R1, R3 i així successivament fins a R5 i R4 siguin quatre registres en la seqüència. Aquí, els registres no són més que una fila en qualsevol taula. Suposem que s'ha d'inserir un nou registre R2 a la seqüència, llavors simplement es col·loca al final del fitxer.
Inserció de nou registre
2. Mètode de fitxer ordenat
En aquest mètode, com el propi nom indica cada vegada que s'ha d'inserir un registre nou, sempre s'insereix de manera ordenada (ascendent o descendent). L'ordenació dels registres es pot basar en qualsevol clau primària o qualsevol altra clau.
Mètode de fitxer ordenat
Inserció del nou disc: Suposem que hi ha una seqüència ordenada preexistent de quatre registres R1, R3 i així successivament fins a R7 i R8. Suposem que s'ha d'inserir un nou registre R2 a la seqüència, llavors s'inserirà al final del fitxer i després ordenarà la seqüència.
nova inserció de registre
Avantatges de l'organització seqüencial de fitxers
- Mètode ràpid i eficaç per a grans quantitats de dades.
- Disseny senzill.
- Els fitxers es poden emmagatzemar fàcilment cintes magnètiques és a dir, un mecanisme d'emmagatzematge més barat.
Inconvenients de l'organització seqüencial de fitxers
- Pèrdua de temps, ja que no podem saltar sobre un registre en particular que es requereix, però ens hem de moure d'una manera seqüencial que pren el nostre temps.
- El mètode de fitxer ordenat és ineficient, ja que necessita temps i espai per ordenar els registres.
Organització de fitxers Heap
Organització de fitxers Heap funciona amb blocs de dades. En aquest mètode, els registres s'insereixen al final del fitxer, als blocs de dades. No cal ordenar ni ordenar en aquest mètode. Si un bloc de dades està ple, el nou registre s'emmagatzema en algun altre bloc, aquí l'altre bloc de dades no ha de ser el següent bloc de dades, però pot ser qualsevol bloc de la memòria. És responsabilitat del DBMS emmagatzemar i gestionar els nous registres.
Organització de fitxers Heap
Inserció del nou disc: Suposem que tenim quatre registres al munt R1, R5, R6, R4 i R3, i suposem que s'ha d'inserir un nou registre R2 al munt, ja que l'últim bloc de dades, és a dir, el bloc de dades 3 està ple, s'inserirà a la pila. qualsevol dels blocs de dades seleccionats pel SGBD, diguem el bloc de dades 1.
com imprimir java
Inserció de nou registre
Si volem cercar, esborrar o actualitzar dades a l'organització del fitxer heap, recorrerem les dades des de l'inici del fitxer fins a obtenir el registre sol·licitat. Així, si la base de dades és molt gran, cercar, esborrar o actualitzar el registre trigarà molt de temps.
Avantatges de l'organització de fitxers Heap
- Obtenir i recuperar registres és més ràpid que els registres seqüencials, però només en el cas de bases de dades petites.
- Quan hi ha un gran nombre de dades que s'han de carregar al base de dades a la vegada, aquest mètode d'organització de fitxers és el més adequat.
Desavantatges de l'organització de fitxers heap
- El problema dels blocs de memòria no utilitzats.
- Ineficient per a bases de dades més grans.
Conclusió
En conclusió, és fonamental triar l'organització de fitxers adequada en a sistema de gestió de bases de dades (DBMS) . Tot i que l'estructura aleatòria ofereix flexibilitat, però pot conduir a la fragmentació, la disposició seqüencial és millor per a l'accés ordenat. La indexació troba un equilibri, la agrupació millora l'eficiència per a consultes particulars i les estructures hash maximitzen l'accés ràpid. L'eficiència sostinguda requereix un manteniment rutinari. La selecció s'ha de basar en els requisits de l'aplicació concreta; per obtenir el millor rendiment del SGBD, pot ser necessària una combinació acurada d'estratègies.
Preguntes freqüents sobre l'organització de fitxers
P.1: Què és l'organització de fitxers?
Resposta:
L'organització de fitxers és bàsicament una relació entre els diferents registres que fa que l'arxiu sigui més fàcil d'identificar i accedir a qualsevol registre.
P.2: Quins són els quatre mètodes d'organització de fitxers?
Resposta:
Els mètodes d'organització de fitxers són
- Seqüencial
- Aleatori
- Serial
- Seqüencial indexat
P.3: Quina diferència hi ha entre l'organització de fitxers seqüencial i l'organització de fitxers heap?
Resposta:
La diferència senzilla entre l'organització de fitxers seqüencial i l'organització de fitxers heap és que l'organització de fitxers seqüencial col·loca les dades en la seqüència adequada, mentre que l'organització de fitxers heap col·loca les dades en ordre arbitrari.
Per a més informació, consulteu Organització de fitxers DBMS: conjunt 2 | Hashing en DBMS .