Nucleu (algebră liniară)

De la Wikipedia, enciclopedia liberă
Jump to navigation Jump to search

În matematică, și mai precis în algebra liniară și analiza funcțională, nucleul (de asemenea, cunoscut sub numele de kernel sau ker, după notația practicată) al unei aplicații liniare L : VW între două spații vectoriale V și W, este mulțimea tuturor elementelor v din V pentru care L(v) = 0 , unde 0 indică vectorul nul din W. Adică, în notația de construcție a mulțimilor,

Proprietăți ale nucleului[modificare | modificare sursă]

Nucleul și imaginea unei aplicații L.

Nucleul lui L este un subspatiu vectorial al domeniului V.[1] În aplicația liniară L : VW , două elemente din V au aceeași imagine în W dacă și numai dacă diferența lor aparține nucleului lui L:

Rezultă că imaginea L este izomorfă cu factorul lui V în raport cu nucleul:

Acest lucru implică teorema rangului:

Dimensiunea imaginii lui L se numește „rang”, iar cea a nucleului se numește „defect”.

Când V este un spațiu cu produs scalar, factorul V / ker(L) poate fi identificat cu complementul ortogonal în V al  lui ker(L). Aceasta este o generalizare a aplicațiilor liniare a spațiului rândurilor unei matrice.

Aplicații în domeniul modulelor[modificare | modificare sursă]

Noțiunea de nucleu se aplică omomorfismelor de module, acestea din urmă fiind o generalizare a spațiilor vectoriale (care sunt definite peste un corp) peste un inel. Domeniul aplicațiilor este un modul, și nucleul constituie un „submodul”. Aici, nu se mai aplică neapărat noțiunile de rang și defect.

Nucleul în analiza funcțională[modificare | modificare sursă]

Dacă V și W sunt spatii vectoriale topologice (și W este finit-dimensional), atunci aplicația liniară L: VW este continuă dacă și numai dacă nucleul lui L este un subspațiu închis al lui V.

Reprezentarea ca înmulțire de matrice[modificare | modificare sursă]

Fie o aplicație liniară reprezentată ca o matrice m × n A cu coeficienți într-un corp K (de obicei, corpul numerelor reale sau al numerelor complexe) și care funcționează ca vectori coloană x cu n componente peste K. Nucleul acestei aplicații liniare este mulțimea soluțiilor ecuației Ax = 0A x = 0 , unde 0 se înțelege ca vector nul. Dimensiunea nucleului lui A se numește defectul lui A. În notația de construcție a mulțimilor,

Ecuația matriceală este echivalentă cu un sistem de ecuații liniare omogen:

Astfel, nucleul lui A este același ca și mulțimea soluțiilor ecuațiilor omogene de mai sus.

Proprietățile subspațiului[modificare | modificare sursă]

Nucleul unei matrice m × n  A peste un corp K este un subspatiu vectorial al lui Kn. Cu alte cuvinte, nucleul lui A, mulțimea ker(A), are următoarele trei proprietăți:

  1. Ker(A) conține întotdeauna vectorul nul, deoarece A0 = 0 .
  2. Dacă x ∈ Null(A) și y ∈ Null(A) , atunci x + y ∈ Null(A) . Acest lucru rezultă din distributivitatea multiplicării matricilor în raport cu adunarea.
  3. Dacă x ∈ Null(A) și c este un scalar cK , atunci cx ∈ Null(A) , deoarece A(cx) = c(Ax) = c0 = 0 .

Spațiul rândurilor unei matrice[modificare | modificare sursă]

Produsul Ax poate fi scris în termeni de produs scalar al vectorilor după cum urmează:

Aici, cu a1, ... , am se notează transpusele rândurilor matricei A. Rezultă că x este în nucleul lui A dacă și numai dacă x este ortogonal pe fiecare vector-rând al lui A (pentru că atunci când produsul scalar a doi vectori este egal cu zero, ei sunt, prin definiție, ortogonali).

Spațiul rândurilor unei matrice A este spațiul generat de vectoriu rând din A. Prin raționamentul de mai sus, nucleul lui A este complement ortogonal al spațiului rândurilor. Cu alte cuvinte, un vector x se află în nucleul lui A dacă și numai dacă este ortogonal pe orice vector din spațiul rândurilor lui A.

Dimensiunea spațiului rândurilor lui A se numește rang al lui A, și dimensiunea nucleului lui A se numește defectul lui A. Aceste cantități sunt legate de teorema rangului

Nucleul la stânga[modificare | modificare sursă]

Nucleul la stânga, sau conucleul unei matrice A este format din toți vectorii x , astfel încât xTA = 0T, unde cu T la exponent se notează transpusa unui vector coloană. Nucleul la stânga al lui A este nucleul lui AT. Nucleul la stânga al lui A este complementul ortogonal al spațiului coloanelor lui A, și este dual cu conucleul asociată aplicației liniare. Nucleul, spațiul rândurilor, spațiul coloanelor, și nucleul la stânga ale lui A sunt cele patru subspații fundamentale asociate matricei A.

Sisteme de ecuatii liniare neomogene[modificare | modificare sursă]

Nucleul joacă un rol și în soluțiile unui sistem de ecuații liniare neomogene:

Dacă u și v sunt două posibile soluții pentru ecuația de mai sus, atunci

Astfel, diferența dintre oricare două soluții pentru ecuația Ax = b se află în nucleul lui A.

Rezultă că orice soluție a ecuației Ax = b poate fi exprimată ca sumă între o soluție fixă v și un element arbitrar din nucleu. Cu alte cuvinte, mulțimea soluțiilor ecuației Ax = b este

Din punct de vedere geometric, aceasta spune că soluția pentru Ax = b este o translație a nucleului lui A prin vectorul v

Ilustrare[modificare | modificare sursă]

Vom da aici un exemplu simplu de calcul al nucleului unei matrice (a se vedea secțiunea Baze de mai jos pentru metode mai potrivite pentru calcule mai complexe). Exemplul atinge și noțiunea de spațiu al rândurilor și relația acesteia cu nucleul.

Fie matricea

Nucleul acestei matrice este format din toți vectorii (x, y, z) ∈ R3 pentru care

ceea ce se poate exprima ca un sistem de ecuații liniare omogen în x, y, și z:

care poate fi scris în formă de matrice ca:

Prin eliminare Gauss–Jordan, se reduce la:

Rescriind, rezultă:

Acum se poate exprima un element al nucleului:

pentru un c scalar.

Deoarece c este o variabilă liberă, acest lucru poate fi exprimat la fel de bine ca:

Nucleul lui A este exact soluția acestor ecuații (în acest caz, un dreaptă prin originea lui R3); vectorul (-1,-26,16)T constituie o bază a nucleului lui A. Astfel, defectul lui A este 1.

Se observă  și că următoarele produse scalare sunt zero:

ceea ce ilustrează faptul că vectorii din nucleul lui A sunt ortogonali pe fiecare vector-rând al lui A.

Acești doi vectori-rând (liniar independenți) generează spațiul rândurilor lui A, un plan ortogonal pe vectorul (-1,-26,16)T.

Cum rangul lui A este 2, defectul lui A este 1, și dimensiunea lui A 3, avem o ilustrare a teoremei rangului.

Exemple[modificare | modificare sursă]

  • Dacă L: RmRn, atunci nucleul lui L este mulțimea soluțiilor unui sistem de ecuații liniare omogen. La fel ca în ilustrația de mai sus, dacă L este aplicația:
atunci nucleul lui L este mulțimea soluțiilor ecuațiilor
  • Fie C[0,1] spațiul vectorial al tuturor funcțiilor continue cu valori reale definite pe intervalul [0,1], fie L: C[0,1] → R definit prin regula:
Atunci nucleul lui L constă din toate funcțiile fC[0,1] pentru care f(0.3) = 0.
  • Fie C(R) spațiul vectorial al tuturor funcțiilor indefinit derivabile: RR, și fie D: C(R) → C(R) operatorul de diferențiere:
Atunci, nucleul lui D este format din toate funcțiile din C(R), care au derivata zero, adică mulțimea tuturor funcțiilor constante.
Atunci nucleul lui s este subspațiu unidimensional format din toți vectorii (x1, 0, 0, ...).

Calcul prin eliminare Gauss[modificare | modificare sursă]

O bază a nucleului unei matrice poate fi calculată prin eliminarea gaussiană.

În acest scop, dată fiind o matrice m × n A, se construiește mai întâi matricea unde II este matricea identitate n × n.

Calculând matricea eșalon pe coloane prin eliminare Gauss (sau orice altă metodă adecvată), se obține o matrice O baza a nucleului lui A constă în coloanele nenule ale lui C astfel încât coloana corespunzătoare din B este o coloană nulă.

În fapt, calculul poate fi oprit de îndată ce partea superioară este matricea în forma eșalon pe coloană: restul calculului constă în schimbarea bazei spațiului vectorial generat de coloanele a căror parte superioară este zero.

De exemplu, să presupunem că

Atunci

Aducând partea de sus în forma eșalon pe coloane prin operațiuni cu coloanele pe întreaga matrice rezultă

Ultimele trei coloane din B sunt coloane nule. Prin urmare, în ultimii trei vectori de C,

sunt o baza a nucleului lui A.

Întrucât operațiile pe coloane corespund pre-multiplicării cu matrice inversabile, faptul că  se reduce la  ne spune că . Cu alte cuvinte, acțiunea lui  via (coloanele lui) corespunde cu acțiunea lui . Întrucât  este în formă eșalon pe coloane, ea acționează trivial doar asupra elementelor bazei elementare ce corespund coloanelor nule din . Întrucât acțiunea lui  corespunde acțiunii lui  prin coloanele lui , coloanele corespunzătoare din  trebuie să fie coloane nule pentru , și trebuie să formeze baza nucleului lui  conform teoremei rangului.

Calcul numeric[modificare | modificare sursă]

Problema de calcul pe calculator al nucleului depinde de natura coeficienților.

Coeficienții exacți[modificare | modificare sursă]

Dacă coeficienții matricei sunt numere date, forma eșalon pe coloane a matricei poate fi calculată prin algoritmul Bareiss mai eficient decât prin eliminare gaussiană. Este chiar mai eficient să se utilizeze aritmetica modulară, care reduce problema la una similară peste un corp finit.[necesită citare]

Pentru coeficienți într-un corp finit, eliminarea gaussiană funcționează bine, dar pentru matrice mari ca cele care apar in criptografie se cunosc algoritmi mai buni, care au aproximativ aceeași complexitate, dar sunt mai rapide și se comportă mai bine pe hardware modern.[necesită citare]

Calculul în virgulă mobilă[modificare | modificare sursă]

Pentru matrice ale căror elemente sunt numere în virgulă mobilă, problema calculării nucleului are sens numai pentru matrice al căror număr de rânduri este egal cu rangul: din cauza erorilor de rotunjire, o matrice cu elemente în virgulă mobilă are aproape întotdeauna rang complet, chiar și atunci când este o aproximare a unei matrice cu rang mult mai mic. Chiar și pentru o matrice cu rang complet, se poate calcula nucleul numai dacă este bine condiționată, adică are un număr de condiționare mic.[2]

Chiar și pentru o matrice cu rang complet bine condiționată, eliminarea gaussiană nu se comportă corect: introduce erori de rotunjire care sunt prea mari pentru a obține un rezultat semnificativ. Întrucât calculul nucleului unei matrice este un caz particular de rezolvare a unui sistem omogen de ecuații liniare, nucleul poate fi calculat de către oricare dintre diverșii algoritmi concepuți pentru a rezolva sisteme omogene. Un software de ultimă generație pentru acest scop este biblioteca Lapack.[necesită citare]

Note[modificare | modificare sursă]

  1. ^ Algebră liniară, așa cum sa discutat în acest articol, este foarte bine stabilit matematică disciplina pentru care există mai multe surse.
  2. ^ https://www.math.ohiou.edu/courses/math3600/lecture11.pdf

Referințe[modificare | modificare sursă]

  • Axler, Sheldon Jay (), Linear Algebra Done Right (ed. 2nd), Springer-Verlag, ISBN 0-387-98259-0.  Mai multe valori specificate pentru |ISBN= și |isbn= (ajutor)
  • Lay, David C. (), Linear Algebra and Its Applications (ed. 3rd), Addison Wesley, ISBN 978-0-321-28713-7.  Mai multe valori specificate pentru |ISBN= și |isbn= (ajutor)
  • Meyer, Carl D. (), Matrix Analysis and Applied Linear Algebra, Society for Industrial and Applied Mathematics (SIAM), ISBN 978-0-89871-454-8.  Mai multe valori specificate pentru |ISBN= și |isbn= (ajutor)
  • Poole, David (), Linear Algebra: A Modern Introduction (ed. 2nd), Brooks/Cole, ISBN 0-534-99845-3.  Mai multe valori specificate pentru |ISBN= și |isbn= (ajutor)
  • Anton, Howard (), Elementary Linear Algebra (Applications Version) (ed. 9th), Wiley International. 
  • Leon, Steven J. (), Linear Algebra With Applications (ed. 7th), Pearson Prentice Hall. 
  • Lang, Serge (). Linear Algebra. ISBN 9780387964126. 
  • Trefethen, Lloyd N.; Bau, David III (), Numerical Linear Algebra, SIAM, ISBN 978-0-89871-361-9.  Mai multe valori specificate pentru |ISBN= și |isbn= (ajutor)

Legături externe[modificare | modificare sursă]