logo

Què és una xarxa neuronal?

Les xarxes neuronals són models computacionals que imiten les funcions complexes del cervell humà. Les xarxes neuronals consisteixen en nodes o neurones interconnectats que processen i aprenen de les dades, permetent tasques com el reconeixement de patrons i la presa de decisions en l'aprenentatge automàtic. L'article explora més sobre les xarxes neuronals, el seu funcionament, l'arquitectura i molt més.

Taula de contingut



Evolució de les xarxes neuronals

Des de la dècada de 1940, hi ha hagut una sèrie d'avenços destacables en el camp de les xarxes neuronals:

  • Dècada de 1940-1950: primers conceptes
    Les xarxes neuronals van començar amb la introducció del primer model matemàtic de neurones artificials per McCulloch i Pitts. Però les limitacions computacionals van dificultar el progrés.
  • 1960-1970: perceptrons
    Aquesta era es defineix pel treball de Rosenblatt sobre els perceptrons. Els perceptrons són xarxes d'una sola capa l'aplicabilitat de les quals es limitava a problemes que es podien resoldre de manera lineal per separat.
  • Anys 80: retropropagació i connectionisme
    Xarxa multicapa La formació va ser possible gràcies a la invenció de Rumelhart, Hinton i Williams del mètode de retropropagació. Amb el seu èmfasi en l'aprenentatge mitjançant nodes interconnectats, el conexionisme va guanyar atractiu.
  • Anys 90: auge i hivern
    Amb aplicacions en identificació d'imatges, finances i altres camps, les xarxes neuronals van veure un auge. La investigació de xarxes neuronals, però, va experimentar un hivern a causa dels costos computacionals exorbitants i les expectatives inflades.
  • Anys 2000: ressorgiment i aprenentatge profund
    Els conjunts de dades més grans, les estructures innovadores i la capacitat de processament millorada van estimular un retorn. Aprenentatge profund ha demostrat una eficàcia sorprenent en diverses disciplines mitjançant la utilització de nombroses capes.
  • 2010-present: domini de l'aprenentatge profund
    Les xarxes neuronals convolucionals (CNN) i les xarxes neuronals recurrents (RNN), dues arquitectures d'aprenentatge profund, van dominar l'aprenentatge automàtic. El seu poder es va demostrar amb innovacions en jocs, reconeixement d'imatges i processament del llenguatge natural.

Què són les xarxes neuronals?

Xarxes neuronals extreu característiques identificatives de les dades, sense una comprensió preprogramada. Els components de la xarxa inclouen neurones, connexions, pesos, biaixos, funcions de propagació i una regla d'aprenentatge. Les neurones reben entrades, governades per llindars i funcions d'activació. Les connexions impliquen pesos i biaixos que regulen la transferència d'informació. L'aprenentatge, ajustant els pesos i els biaixos, es produeix en tres etapes: càlcul d'entrada, generació de sortides i perfeccionament iteratiu que millora la competència de la xarxa en tasques diverses.

lectura de fitxers csv en java

Això inclou:



  1. La xarxa neuronal és simulada per un nou entorn.
  2. A continuació, els paràmetres lliures de la xarxa neuronal es modifiquen com a resultat d'aquesta simulació.
  3. Aleshores, la xarxa neuronal respon d'una manera nova a l'entorn a causa dels canvis en els seus paràmetres lliures.
nn-Geeksforgeeks


Importància de les xarxes neuronals

La capacitat de les xarxes neuronals per identificar patrons, resoldre trencaclosques complexos i adaptar-se a l'entorn canviant és essencial. La seva capacitat d'aprendre de les dades té efectes de gran abast, que van des de revolucionar la tecnologia com processament del llenguatge natural i automòbils amb conducció autònoma per automatitzar els processos de presa de decisions i augmentar l'eficiència en nombroses indústries. El desenvolupament de la intel·ligència artificial depèn en gran mesura de les xarxes neuronals, que també impulsen la innovació i influeixen en la direcció de la tecnologia.

Com funcionen les xarxes neuronals?

Anem a entendre amb un exemple de com funciona una xarxa neuronal:



Penseu en una xarxa neuronal per a la classificació del correu electrònic. La capa d'entrada pren funcions com el contingut del correu electrònic, la informació del remitent i l'assumpte. Aquestes entrades, multiplicades per pesos ajustats, passen per capes ocultes. La xarxa, a través de la formació, aprèn a reconèixer patrons que indiquen si un correu electrònic és correu brossa o no. La capa de sortida, amb una funció d'activació binària, prediu si el correu electrònic és correu brossa (1) o no (0). A mesura que la xarxa perfecciona iterativament els seus pesos mitjançant la retropropagació, esdevé experta per distingir entre correu brossa i correus electrònics legítims, mostrant la pràctica de les xarxes neuronals en aplicacions del món real com el filtratge de correu electrònic.

nova línia en Python

Funcionament d'una xarxa neuronal

Les xarxes neuronals són sistemes complexos que imiten algunes característiques del funcionament del cervell humà. Està compost per una capa d'entrada, una o més capes ocultes i una capa de sortida formada per capes de neurones artificials que s'acoblen. Les dues etapes del procés bàsic s'anomenen retropropagació i propagació cap endavant .

nn-ar-Geeksforgeeks


Propagació cap endavant

  • Capa d'entrada: Cada característica de la capa d'entrada està representada per un node a la xarxa, que rep les dades d'entrada.
  • Peses i connexions: El pes de cada connexió neuronal indica com de forta és la connexió. Al llarg de l'entrenament, aquests pesos es modifiquen.
  • Capes ocultes: Cada neurona de capa oculta processa les entrades multiplicant-les per pesos, sumant-les i després passant-les per una funció d'activació. D'aquesta manera, s'introdueix la no linealitat, que permet a la xarxa reconèixer patrons complexos.
  • Sortida: El resultat final es produeix repetint el procés fins a arribar a la capa de sortida.

Retropropagació

  • Càlcul de pèrdues: La sortida de la xarxa s'avalua amb els valors de l'objectiu real i s'utilitza una funció de pèrdua per calcular la diferència. Per a un problema de regressió, el Error quadrat mitjà (MSE) s'utilitza habitualment com a funció de cost.
    Funció de pèrdua: MSE = frac{1}{n} Sigma^{n}_{i=1} (y_{i} - hat y_{i})^2
  • Descens del gradient: A continuació, la xarxa utilitza el descens del gradient per reduir la pèrdua. Per reduir la imprecisió, es canvien els pesos en funció de la derivada de la pèrdua respecte a cada pes.
  • Ajust de pesos: Els pesos s'ajusten a cada connexió aplicant aquest procés iteratiu, o retropropagació , cap enrere a tota la xarxa.
  • Formació: Durant l'entrenament amb diferents mostres de dades, tot el procés de propagació cap endavant, càlcul de pèrdues i retropropagació es fa de manera iterativa, permetent que la xarxa s'adapti i aprengui patrons a partir de les dades.
  • Funcions d'activació: La no linealitat del model s'introdueix mitjançant funcions d'activació com el unitat lineal rectificada (ReLU) hores sigmoide . La seva decisió sobre si s'activa una neurona es basa en tota l'entrada ponderada.

Aprenentatge d'una xarxa neuronal

1. Aprenentatge amb aprenentatge supervisat

En aprenentatge supervisat , la xarxa neuronal és guiada per un professor que té accés als dos parells d'entrada-sortida. La xarxa crea sortides basades en entrades sense tenir en compte l'entorn. En comparar aquestes sortides amb les sortides desitjades conegudes pel professor, es genera un senyal d'error. Per tal de reduir els errors, els paràmetres de la xarxa es canvien iterativament i s'aturen quan el rendiment és a un nivell acceptable.

dormir en javascript

2. Aprenentatge amb aprenentatge no supervisat

No hi ha variables de sortida equivalents aprenentatge no supervisat . El seu objectiu principal és comprendre l'estructura subjacent de les dades entrants (X). No hi ha cap instructor per oferir consells. En canvi, el resultat previst és modelar patrons i relacions de dades. Paraules com regressió i classificació estan relacionades amb l'aprenentatge supervisat, mentre que l'aprenentatge no supervisat s'associa amb l'agrupació i l'associació.

3. Aprenentatge amb Aprenentatge de reforç

Mitjançant la interacció amb l'entorn i la retroalimentació en forma de recompenses o penalitzacions, la xarxa adquireix coneixement. L'objectiu de la xarxa és trobar una política o estratègia que optimitzi les recompenses acumulades al llarg del temps. Aquest tipus s'utilitza amb freqüència en aplicacions de jocs i de presa de decisions.

Tipus de xarxes neuronals

N'hi ha set tipus de xarxes neuronals que es poden utilitzar.

  • Xarxes de feedforward: A xarxa neuronal anticipada és una arquitectura de xarxa neuronal artificial senzilla en la qual les dades es mouen de l'entrada a la sortida en una única direcció. Té capes d'entrada, ocultes i de sortida; no hi ha bucles de retroalimentació. La seva arquitectura senzilla el fa adequat per a diverses aplicacions, com ara la regressió i el reconeixement de patrons.
  • Perceptró multicapa (MLP): MLP és un tipus de xarxa neuronal anticipada amb tres o més capes, inclosa una capa d'entrada, una o més capes ocultes i una capa de sortida. Utilitza funcions d'activació no lineals.
  • Xarxa neuronal convolucional (CNN): A Xarxa neuronal convolucional (CNN) és una xarxa neuronal artificial especialitzada dissenyada per al processament d'imatges. Utilitza capes convolucionals per aprendre automàticament les característiques jeràrquiques de les imatges d'entrada, permetent el reconeixement i la classificació d'imatges eficaços. Les CNN han revolucionat la visió per ordinador i són fonamentals en tasques com la detecció d'objectes i l'anàlisi d'imatges.
  • Xarxa neuronal recurrent (RNN): Un tipus de xarxa neuronal artificial destinat al processament de dades seqüencial s'anomena a Xarxa neuronal recurrent (RNN). És adequat per a aplicacions on les dependències contextuals són crítiques, com ara la predicció de sèries temporals i el processament del llenguatge natural, ja que fa ús de bucles de retroalimentació, que permeten que la informació sobrevisqui a la xarxa.
  • Memòria a curt termini (LSTM): LSTM és un tipus de RNN dissenyat per superar el problema del gradient de desaparició en l'entrenament de RNN. Utilitza cel·les i portes de memòria per llegir, escriure i esborrar informació selectivament.

Implementació senzilla d'una xarxa neuronal

Python 3

import> numpy as np> # array of any amount of numbers. n = m> X>=> np.array([[>1>,>2>,>3>],> >[>3>,>4>,>1>],> >[>2>,>5>,>3>]])> # multiplication> y>=> np.array([[.>5>, .>3>, .>2>]])> # transpose of y> y>=> y.T> # sigma value> sigm>=> 2> # find the delta> delt>=> np.random.random((>3>,>3>))>-> 1> for> j>in> range>(>100>):> > ># find matrix 1. 100 layers.> >m1>=> (y>-> (>1>/>(>1> +> np.exp(>->(np.dot((>1>/>(>1> +> np.exp(> >->(np.dot(X, sigm))))), delt))))))>*>((>1>/>(> >1> +> np.exp(>->(np.dot((>1>/>(>1> +> np.exp(> >->(np.dot(X, sigm))))), delt)))))>*>(>1>->(>1>/>(> >1> +> np.exp(>->(np.dot((>1>/>(>1> +> np.exp(> >->(np.dot(X, sigm))))), delt)))))))> ># find matrix 2> >m2>=> m1.dot(delt.T)>*> ((>1>/>(>1> +> np.exp(>->(np.dot(X, sigm)))))> >*> (>1>->(>1>/>(>1> +> np.exp(>->(np.dot(X, sigm)))))))> ># find delta> >delt>=> delt>+> (>1>/>(>1> +> np.exp(>->(np.dot(X, sigm))))).T.dot(m1)> ># find sigma> >sigm>=> sigm>+> (X.T.dot(m2))> # print output from the matrix> print>(>1>/>(>1> +> np.exp(>->(np.dot(X, sigm)))))>
>
>

Sortida:

[[0.99999325 0.99999375 0.99999352]  [0.99999988 0.99999989 0.99999988]  [1. 1. 1. ]]>

Avantatges de les xarxes neuronals

Les xarxes neuronals s'utilitzen àmpliament en moltes aplicacions diferents a causa dels seus nombrosos beneficis:

  • Adaptabilitat: Les xarxes neuronals són útils per a activitats on el vincle entre entrades i sortides és complex o no està ben definit perquè poden adaptar-se a noves situacions i aprendre de les dades.
  • Reconeixement de patró: La seva competència en el reconeixement de patrons els fa eficaços en tasques com ara la identificació d'àudio i imatges, el processament del llenguatge natural i altres patrons de dades complexos.
  • Processament paral·lel: Com que les xarxes neuronals són capaços de processar-se en paral·lel per naturalesa, poden processar nombrosos treballs alhora, la qual cosa accelera i millora l'eficiència dels càlculs.
  • No linealitat: Les xarxes neuronals són capaços de modelar i comprendre relacions complicades en dades en virtut de les funcions d'activació no lineals que es troben a les neurones, que superen els inconvenients dels models lineals.

Inconvenients de les xarxes neuronals

Les xarxes neuronals, encara que poderoses, no estan exemptes d'inconvenients i dificultats:

  • Intensitat computacional: L'entrenament de grans xarxes neuronals pot ser un procés laboriós i exigent computacionalment que requereix molta potència de càlcul.
  • Caixa negra Natura: Com a models de caixa negra, les xarxes neuronals suposen un problema en aplicacions importants, ja que és difícil entendre com prenen decisions.
  • Sobreajustament: El sobreajust és un fenomen en què les xarxes neuronals envien material d'entrenament a la memòria en lloc d'identificar patrons a les dades. Tot i que els enfocaments de regularització ajuden a pal·liar-ho, el problema encara existeix.
  • Necessitat de grans conjunts de dades: Per a un entrenament eficient, les xarxes neuronals sovint necessiten conjunts de dades importants i etiquetats; en cas contrari, el seu rendiment pot patir dades incompletes o esbiaixades.

Preguntes freqüents (FAQ)

1. Què és una xarxa neuronal?

Una xarxa neuronal és un sistema artificial format per nodes interconnectats (neurones) que processen la informació, modelada a partir de l'estructura del cervell humà. S'utilitza en treballs d'aprenentatge automàtic on s'extreuen patrons de dades.

taula de reaccions

2. Com funciona una xarxa neuronal?

Les capes de neurones connectades processen dades a les xarxes neuronals. La xarxa processa les dades d'entrada, modifica els pesos durant l'entrenament i produeix una sortida en funció dels patrons que ha descobert.

3. Quins són els tipus comuns d'arquitectures de xarxes neuronals?

Les xarxes neuronals de feedforward, les xarxes neuronals recurrents (RNN), les xarxes neuronals convolucionals (CNN) i les xarxes de memòria a curt termini (LSTM) són exemples d'arquitectures comunes dissenyades cadascuna per a una tasca determinada.

4. Quina diferència hi ha entre l'aprenentatge supervisat i no supervisat a les xarxes neuronals?

En l'aprenentatge supervisat, les dades etiquetades s'utilitzen per entrenar una xarxa neuronal de manera que pugui aprendre a mapejar les entrades a les sortides coincidents. L'aprenentatge no supervisat funciona amb dades sense etiqueta i cerca estructures o patrons a les dades .

5. Com gestionen les xarxes neuronals les dades seqüencials?

Els bucles de retroalimentació que incorporen les xarxes neuronals recurrents (RNN) els permeten processar dades seqüencials i, amb el temps, capturar dependències i context.