Reţea neuronală

De la Wikipedia, enciclopedia liberă

(Redirecţionat de la Reţele neuronale)
Salt la: Navigare, căutare
Inteligenţă artificială
GOFAI
Cercetare state space
Planificare automatizată
Căutare combinatorială
Sistem expert
Reprezentarea cunoaşterii
Sistem bazat pe cunoaştere
Conecţionism
Reţele neuronale
Viaţă artificială
IA distribuită
Programare genetică
Algoritm genetic
Inteligenţă "roi"
Fiinţă artificială
Metoda empirică Bayes
Reţea bayesiană
Învăţare la maşini
Recunoaşterea tiparelor
Sisteme Fuzzy
Logică fuzzy
Electronică fuzzy
Filozofie
IA Puternică
Conştiinţă artificială
Test Turing

În ştiinţa inteligenţei artificiale, reţelele neurale caracterizează ansambluri de elemente de procesare simple, puternic interconectate şi operând în paralel, care urmăresc să interacţioneze cu mediul înconjurător într-un mod asemănător creierelor biologice şi care prezintă capacitatea de a învăţa. Nu există o definiţie general acceptată a acestor tipuri de sisteme, dar majoritatea cercetătorilor sunt de acord cu definirea reţelelor artificiale ca reţele de elemente simple puternic interconectate prin intermediul unor legături numite interconexiuni prin care se propagă informaţie numerică.

Originea acestor reţele trebuie căutată în studierea reţelelor bioelectrice din creier formate de neuroni şi sinapsele acestora. Principala trăsătură a acestor reţele este capacitatea de a învăţa pe bază de exemple, folosindu-se de experienţa anterioară pentru a-şi îmbunătăţi performanţele.

Cuprins

[modifică] Structură

Deşi se aseamănă în funcţionare cu creierul uman, reţelele neuronale au o structură diferită de cea a creierului. O reţea neurală este mult mai simplă decât corespondentul uman, dar la fel ca şi creierul uman, este compusă din unităţi puternice de calcul, mult inferioare însă corespondentului uman, neuronul.

[modifică] Caracteristici

Reţelele neurale artificiale se pot caracteriza pe baza a 3 elemente:

  • modelul adoptat pentru elementul de procesare individual,
  • structura particulară de interconexiuni (arhitectura)
  • mecanismele de ajustare a legăturilor (algoritmii de învăţare).

[modifică] Modele ale neuronului artificial

Sunt mai multe criterii de clasificare a modelelor neuronului elementar, ce implică: domeniul de definiţie a semnalelor folosite, natura datelor folosite, tipul funcţiei de activare, prezenţa memoriei. Dar cel mai utilizat model este modelul aditiv.

Modelul aditiv al neuronului artificial

[modifică] Arhitecturi

O reţea neurală de tip feedforward

Există numeroase modalităţi de interconectare a neuronilor elementari, dar pot fi identificate două clase de arhitecturi:

  • cu propagare a informaţiei numai dinspre intrare spre ieşire, reţele de tip feedforward
  • reţele recurente (cu reacţie).

Un dezavantaj al reţelelor neurale îl constituie lipsa teoriei care să precizeze tipul reţelei şi numărul de neuroni elementari, precum şi modalitatea de interconectare. Există câteva tehnici de tip pruning sau de tip learn and grow, dar acestea sunt în intense cercetări.

[modifică] Algoritimi de învăţare

Principala deosebire a reţelelor neurale faţă de alte sisteme de prelucrare a informaţiilor îl constituie capacitatea de învăţare în urma interacţiunii cu mediul înconjurător, şi îmbunătăţirii performanţelor. O reprezentare corectă a informaţiilor, care să permită interpretarea, predicţia şi răspunsul la un stimul extern, poate permite reţelei să construiască un model al procesului analizat. Acest model va putea răspunde astfel unor stimuli neutilizaţi în procesul prelabil de învăţare. Informaţiile utilizate în procesul de învăţare pot fi: informaţii disponibile a priori sau perechi intrare-ieşire(care stabilesc relaţii de tipul cauză-efect), iar modul de reprezentare internă urmăreşte un set de reguli bine documentate. Aceşti algoritmi pot fi clasificaţi după mai multe criterii cum ar fi: disponibilitatea răspunsului dorit la ieşirea reţelei, existenţa unui model analitic, tipul aplicaţiei în care sunt utilizaţi, dar cele mai multe documentaţii se rezumă la două clase mari: învăţarea supravegheată (care presupune existeţa în orice moment a unei valori dorite a fiecărui neuron din stratul de ieşire) şi învăţarea nesupravegheată (în care reţeaua extrage singură anumite caracteristici importante a datelor de ieşire, în urma unui gen de competiţie între neuronii elementari). În ultima perioadă se remarcă încă o clasă de algoritmi, algoritmii de învăţare folosind un critic, rezultaţi în urma observaţiilor experimentale făcute pe animale, acestia fiind de tipul recompensă/pedeapsă.

[modifică] Aplicaţii în viaţa de zi cu zi

Domeniile în care reţelele neurale realizează modele eficiente sunt :

  • Aproximări de funcţii
  • Predicţii a unor serii temporale
  • Clasificări
  • Recunoaştere de tipare
  • Recunoaştere vocală
  • Scanarea retinei
  • Învăţarea robotului care se verifică în mod constant cu un om

Astfel implementări ale reţelelor neurale, legate de sectorul bussines se întâlnesc în:

  • previziuni financiare
  • controlul proceselor industriale
  • cercetări de piaţă
  • validări de date pe bază de clasificări şi de tipare
  • managementul riscului
  • previziuni de marketing

Reţele neurale folosind algoritmi genetici pot fi folosite în controlul roboţilor industriali. Un alt domeniu de interes pentru reţelele neurale este medicina şi sistemele biomedicale. În acest moment se utilizează reţele neurale pentru descoperirea de boli, prin recunoaşterea unor tipare de pe cardiograme, ş.a.

[modifică] Istoric

Studiul reţelelor neurale a cunoscut perioade în care activitatea de cercetare a fost extrem de intensă şi perioade în care acesta a fost declarat complet "mort" pentru ca apoi să revină în centrul atenţiei, atât în rândul cercetătorilor cât şi a publicului larg prin multitudinea de aplicaţii practice pe care le au sau le pot avea.

Primi paşi au fost făcuţi la sfârşitul secolului al XIX-lea şi începutul secolului al XX-lea, de către Hermann von Helmholz, Ernst Mach şi Ivan Pavlov care au emis teorii asupra procesului de învăţare, asupra condiţionării, etc. Aceste teorii nu au adus nici un fel de modele matematice şi nu se putea vorbi încă de un inceput. Adevăratul punct de pornire al acestui domeniu se situează la începtul anilor 1940 când Warren McCulloch şi Walter Pitts au pus în evidenţă primul model formal al neuronului, evidenţiind capacitatea de calcul a acestuia şi posibilitatea de implementare cu ajutorul circuitelor electronice.

Pe la sfirşitul anilor 1940, Hebb, având la bază teoriile lui Pavlov, a enunţat principiul adaptării permeabilităţii sinaptice conform căruia de fiecare dată cind o conexiune sinaptică este folosită, permeabilitatea ei creşte. Acest principiu stă la baza procesului de învăţare prin modificarea ponderilor sinaptice.

În anii 1950 apare şi prima aplicaţie practică, Frank Rosenblatt realizează o implementare hard, numită perceptron, utilizată în recunoaşterea caracterelor. Tot în anii 1950 Bernard Windrow şi Ted Hoff dezvoltă algoritmi de învăţare pentru reţele neuronale liniare cu un singur nivel de unităţi funcţionale. Algoritmii lor sunt bazaţi pe minimizarea erorii pe setul de date de antrenare. În anul 1969 Marvin Minsky şi Seymor Papert publică cartea "Perceptrons" care pune în evidenţă limitările la care sunt supuse retelele neuronale cu un singur nivel de unităţi funcţionale. Acesta părea a fi sfirşitul reţelelor neuronale. Publicarea acestui material, corelată cu lipsa unor echipamente de calcul digital suficient de puternice, face ca o mare parte din companiile care investeau în cercetarile din acest domeniu să se reorienteze, iar o mare parte dintre cercetători îşi abandonează studiul în această directie.

Anii 1970 sunt mult mai liniştiţi şi doar câţiva cercetători mai sint cu adevărat activi în domeniu. Printre ei merită amintiţi Teuvo Kohonen, Sames Anderson precum şi Stephen Grossberg (foarte activ în cercetarea reţelelor cu auto-organizare).

Anii 1980 aduc, pe lângă noi descoperiri în domeniul reţelelor neurale, şi calculatoare digitale mai puternice capabile să ajute cercetătorii în demersurile lor. Astfel că la începutul anilor 1980, odată cu o nouă abordare a reţelelor folosind formalismul fizicii statistice prin punerea în evidenţă a analogiei între reţelele recurente (destinate memorării asociative) şi sistemele de spini magnetici propusă de John Hopfield se marchează începutul unei noi perioade de interes în domeniu, caracterizată prin extinderea domeniilor de aplicabilitate şi volumul mare de implementari soft şi hard folosite în aplicaţiile practice.

[modifică] Bibliografie

  • Ciocoiu Iulian, Reţele neurale artificiale, ISBN 973-8173-16-7
  • Daniela Zaharie, Curs Retele neuronale
  • Ben Krose and Patrick van der Smagt, An introduction to Neural Network, Amsterdam, 1996, University of Amsterdam
  • Nikola K. Kasabov, Foundation of Neural Networks, Fuzzy systems, and Knowledge Engineering, Cambridge, The MIT Press, 1998
  • Bernard Widrow and Michael A. Lehr, 30 Years of adaptive neural networks: Perceptron, Madaline, and Backpropagation, Proceedings of the IEEE, vol. 78 no.9,September 1990
  • Dave Anderson and George McNeill, ARTIFICIAL NEURAL NETWORKS TECHNOLOGY, Kaman Sciences Corporation, 1992, New York
  • Dumitrescu, D., Costin, H., Retele neuronale; teorie si aplicatii, Teora, Bucuresti, 1996.
  • Alin Brindusescu, Notiuni introductive
Unelte personale