Varianță

În teoria probabilității și statistică, varianța reprezintă media deviațiilor pătratice a unei variabile aleatoare de la media sa. Informal spus, măsoară depărtarea valorilor individuale (aleatoare) dintr-o mulțime, de la media lor. Varianța are un rol crucial în statistică, fiind folosită în statistica descriptivă, statistica inferențială, testarea ipotezelor, calitatea modelării și metodele Monte Carlo. Astfel de metode statistice se folosesc pretutindeni în știință. Varianța reprezintă pătratul deviației standard, al doilea moment central al unei distribuții, și covarianța unei variabile aleatoare cu sine însuși, fiind adesea reprezentată prin $\sigma ^{2}$ , $s^{2}$ sau $\operatorname {Var} (X)$ .

Definiție

Varianța unei variabile aleatoare $X$ este speranța matematică (i.e. media) a deviațiilor pătratice de la media lui $X$ , $\mu =\operatorname {E} [X]$ :

\operatorname {Var} (X)=\operatorname {E} \left[(X-\mu )^{2}\right].

Această definiție cuprinde variabile aleatoare ce pot fi generate de procese discrete, continue, mixte sau Cantoriene. Varianța poate fi, de asemenea, definită ca reprezentând covarianța unei variabile aleatoare cu sine însăși:

$\operatorname {Var} (X)=\operatorname {Cov} (X,X).$

Varianța este echivalentă cu al doilea cumulant al unei distribuții de probabilitate ce generează $X$ . Varianța este desemnată prin $\operatorname {Var} (X)$ , $\sigma _{X}^{2}$ , sau $\sigma ^{2}$ (pronunțat "sigma pătrat"). Expresia varianței poate fi dezvoltată:

${\begin{aligned}\operatorname {Var} (X)&=\operatorname {E} \left[(X-\operatorname {E} [X])^{2}\right]\\[4pt]&=\operatorname {E} \left[X^{2}-2X\operatorname {E} [X]+\operatorname {E} [X]^{2}\right]\\[4pt]&=\operatorname {E} \left[X^{2}\right]-2\operatorname {E} [X]\operatorname {E} [X]+\operatorname {E} [X]^{2}\\[4pt]&=\operatorname {E} \left[X^{2}\right]-\operatorname {E} [X]^{2}\end{aligned}}$

Cu alte cuvinte, variația lui X este egală cu media valorilor pătratice ale lui X minus pătratul mediei lui X. Această ecuația nu trebuie folosită în programe de calcul ce folosesc virgula mobilă datorită fenomenului de reducere numerică ce apare când cei doi termeni au mărimi identice. Există alternative în algoritmii stabili numeric.

Variabilă aleatoare discretă

Dacă distribuția variabilei aleatoare $X$ este discretă, având funcția de masă $x_{1}\mapsto p_{1},x_{2}\mapsto p_{2},\ldots ,x_{n}\mapsto p_{n}$ , atunci:

$\operatorname {Var} (X)=\sum _{i=1}^{n}p_{i}\cdot (x_{i}-\mu )^{2},$

sau echivalent:

$\operatorname {Var} (X)=\left(\sum _{i=1}^{n}p_{i}x_{i}^{2}\right)-\mu ^{2},$

unde $\mu$ reprezintă speranța matematică (i.e media distribuției):

$\mu =\sum _{i=1}^{n}p_{i}x_{i}.$

(În cazul în care suma ponderilor valorilor individuale nu este egală cu 1, atunci ecuația de mai sus trebuie împărțită la respectiva sumă).

Varianța unei mulțimi de $n$ elemente, având probabilități echivalente, poate fi scrisă ca:

$\operatorname {Var} (X)={\frac {1}{n}}\sum _{i=1}^{n}(x_{i}-\mu )^{2},$

unde $\mu$ este valoarea medie, adică,

$\mu ={\frac {1}{n}}\sum _{i=1}^{n}x_{i}.$

Varianța poate fi exprimată și fără referirea directă la medie, ca reprezentând deviațiile pătratice a tuturor valorilor de la fiecare valoare în parte. Pentru o mulțime de $n$ elemente, având probabilități echivalente, avem: ^[1]

$\operatorname {Var} (X)={\frac {1}{n^{2}}}\sum _{i=1}^{n}\sum _{j=1}^{n}{\frac {1}{2}}(x_{i}-x_{j})^{2}={\frac {1}{n^{2}}}\sum _{i}\sum _{j>i}(x_{i}-x_{j})^{2}.$

Variabilă aleatoare continuă

Dacă variabila $X$ este generată de o distribuție continuă cu o funcție de densitate de probabilitate $f(x)$ , și $F(x)$ este funcția de distribuție cumulativă corespunzătoare, atunci varianța populației este dată de:

${\begin{aligned}\operatorname {Var} (X)=\sigma ^{2}&=\int (x-\mu )^{2}f(x)\,dx\\[4pt]&=\int x^{2}f(x)\,dx-2\mu \int xf(x)\,dx+\int \mu ^{2}f(x)\,dx\\[4pt]&=\int x^{2}\,dF(x)-2\mu \int x\,dF(x)+\mu ^{2}\int \,dF(x)\\[4pt]&=\int x^{2}\,dF(x)-2\mu \cdot \mu +\mu ^{2}\cdot 1\\[4pt]&=\int x^{2}\,dF(x)-\mu ^{2},\end{aligned}}$

sau echivalent, putem scrie

$\operatorname {Var} (X)=\int x^{2}f(x)\,dx-\mu ^{2},$

Unde $\mu$ reprezintă speranța matematică (i.e. media) a lui $X$ dată de:

$\mu =\int xf(x)\,dx=\int x\,dF(x),$

cu integrale definite pe intervalul variabilei $x$ .

Dacă o distribuție continuă nu are o speranță matematică finită (i.e. medie), cum este cazul distribuției Cauchy, nu poate avea nici varianță. Multe alte distribuții pentru care speranța matematică este finită, nu au varianță (finită) pentru că integrala varianței este divergentă. Un astfel de exemplu este dat de distribuția Pareto, al cărui index $k$ satisface $1<k\leq 2.$ .

Exemple

Distribuția normală

Distribuția normală cu parametrii $\mu$ și $\sigma$ este o distribuție continuă (cunoscută și sub numele de distribuție Gaussiană) a cărei funcție de densitate a probabilității este dată de:

$f(x)={\frac {1}{\sqrt {2\pi \sigma ^{2}}}}e^{-{\frac {(x-\mu )^{2}}{2\sigma ^{2}}}}.$

În această distribuție, $\operatorname {E} [X]=\mu$ și varianța $\operatorname {Var} (X)$ sunt legate de $\sigma$ prin:

\operatorname {Var} (X)=\int _{-\infty }^{\infty }{\frac {x^{2}}{\sqrt {2\pi \sigma ^{2}}}}e^{-{\frac {(x-\mu )^{2}}{2\sigma ^{2}}}}\,dx-\mu ^{2}=\sigma ^{2}.

Rolul distribuției normale în teoria limitei centrale este, în parte, responsabilă pentru prevalența varianței în probabilitate și statistică.

Distribuția exponențială

Distribuția exponențială cu paramentrul $\lambda$ este o distribuție continuă definită pe intervalul semi-infinit $[0,\infty )$ . Funcția densității de probabilitate este dată de:

$f(x)=\lambda e^{-\lambda x}$ , având o speranță matematică (i.e. medie) egală cu $\mu =\lambda ^{-1}$ . Prin urmare, varianța este egală cu:

$\operatorname {Var} (X)=\int _{0}^{\infty }x^{2}\lambda e^{-\lambda x}\,dx-\mu ^{2}=\lambda ^{-2}.$

De aici rezultă că, pentru distribuția exponențială, avem relația $\sigma ^{2}=\mu ^{2}.$

Distribuția Poisson

Singurul ei parametru este $\lambda$ . Distribuția Poisson este o distribuție discretă pentru $k=0,1,2,\ldots$ . Funcția de masă a probabilității este:

$p(k)={\frac {\lambda ^{k}}{k!}}e^{-\lambda },$ iar speranța matematică (i.e. media) este: $\mu =\lambda$ . Astfel, varianța este egală cu:

$\operatorname {Var} (X)=\left(\sum _{k=0}^{\infty }k^{2}{\frac {\lambda ^{k}}{k!}}e^{-\lambda }\right)-\mu ^{2}=\lambda ,$

De aici rezultă că, pentru distribuția Poisson, avem relația: $\sigma ^{2}=\mu$ .

Distribuția binomială

Parametrii săi sunt $n$ și $p$ . Distribuția este o distribuție discretă pentru $k=0,1,2,\ldots ,n$ . Funcția de masă a probabilității este:

$p(k)={n \choose k}p^{k}(1-p)^{n-k},$ iar speranța matematică (i.e. media) este $\mu =np$ . Astfel, varianța este egală cu:

$\operatorname {Var} (X)=\left(\sum _{k=0}^{n}k^{2}{n \choose k}p^{k}(1-p)^{n-k}\right)-\mu ^{2}=np(1-p).$

Spre exemplu, distribuția binomială cu $p=1/2$ descrie probabilitatea de a obține de $k$ ori o oarecare față (exp. ban) în cazul aruncării unei monede de $n$ ori. Deci, speranța matematică (i.e. media) pentru a obține una dintre fețe este $n/2,$ , iar varianța este $n/4.$

Aruncarea cu zarul

Un zar cu șase fețe poate fi modelat, conform distribuției binomiale, ca o distribuție cu variabilă discretă X , ce poate lua valori de la 1 la 6, fiecare cu probabilitate egală de 1/6. Speranța matematică (i.e. media) a lui X este $(1+2+3+4+5+6)/6=7/2.$ Prin urmare, varianța lui X este:

${\begin{aligned}\operatorname {Var} (X)&=\sum _{i=1}^{6}{\frac {1}{6}}\left(i-{\frac {7}{2}}\right)^{2}\\[5pt]&={\frac {1}{6}}\left((-5/2)^{2}+(-3/2)^{2}+(-1/2)^{2}+(1/2)^{2}+(3/2)^{2}+(5/2)^{2}\right)\\[5pt]&={\frac {35}{12}}\approx 2.92.\end{aligned}}$

Formula generală pentru varianța lui X , dacă avem un zar cu n fețe $n$ -sided, este:

${\begin{aligned}\operatorname {Var} (X)&=\operatorname {E} (X^{2})-(\operatorname {E} (X))^{2}\\[5pt]&={\frac {1}{n}}\sum _{i=1}^{n}i^{2}-\left({\frac {1}{n}}\sum _{i=1}^{n}i\right)^{2}\\[5pt]&={\frac {(n+1)(2n+1)}{6}}-\left({\frac {n+1}{2}}\right)^{2}\\[4pt]&={\frac {n^{2}-1}{12}}.\end{aligned}}$

Proprietăți

Proprietăți fundamentale

Varianța este non-negativă, deoarece din ridicarea la pătrat poate rezulta doar un număr pozitiv sau zero:

$\operatorname {Var} (X)\geq 0.$

Varianța unei variabile aleatoare constante este zero, și, invers, dacă varianța unei variabile este zero, atunci variabila este o constantă:

$P(X=a)=1\iff \operatorname {Var} (X)=0.$

Varianța este invariabilă relativ la schimbările parametrului de poziție. Astfel, dacă o constantă este adăugată (prin adiție) tuturor valorilor pe care le ia variabila, varianța rămâne neschimbată:

$\operatorname {Var} (X+a)=\operatorname {Var} (X).$

Dacă toate valorile variabilei sunt multiplicate cu o constantă, varianța variabilei este multiplicată cu pătratul acelei constante (adică proprietatea de scalare):

$\operatorname {Var} (aX)=a^{2}\operatorname {Var} (X).$

Varianța sumei a două variabile aleatoare este dată de relația:

$\operatorname {Var} (aX+bY)=a^{2}\operatorname {Var} (X)+b^{2}\operatorname {Var} (Y)+2ab\,\operatorname {Cov} (X,Y),$

$\operatorname {Var} (aX-bY)=a^{2}\operatorname {Var} (X)+b^{2}\operatorname {Var} (Y)-2ab\,\operatorname {Cov} (X,Y),$

unde $Cov(\cdot, \cdot)$ reprezintă covarianța. În general, dacă avem o sumă de $N$ variabile aleatoare, $\{X_{1},\dots ,X_{N}\}$ , relația se prezintă ca:

$\operatorname {Var} \left(\sum _{i=1}^{N}X_{i}\right)=\sum _{i,j=1}^{N}\operatorname {Cov} (X_{i},X_{j})=\sum _{i=1}^{N}\operatorname {Var} (X_{i})+\sum _{i\neq j}\operatorname {Cov} (X_{i},X_{j}).$

Aceste rezultate conduc la varianța combinațiilor liniare:

${\begin{aligned}\operatorname {Var} \left(\sum _{i=1}^{N}a_{i}X_{i}\right)&=\sum _{i,j=1}^{N}a_{i}a_{j}\operatorname {Cov} (X_{i},X_{j})\\&=\sum _{i=1}^{N}a_{i}^{2}\operatorname {Var} (X_{i})+\sum _{i\not =j}a_{i}a_{j}\operatorname {Cov} (X_{i},X_{j})\\&=\sum _{i=1}^{N}a_{i}^{2}\operatorname {Var} (X_{i})+2\sum _{1\leq i<j\leq N}a_{i}a_{j}\operatorname {Cov} (X_{i},X_{j}).\end{aligned}}$

Dacă variabilele aleatoare $X_{1},\dots ,X_{N}$ sunt astfel încât:

$\operatorname {Cov} (X_{i},X_{j})=0\ ,\ \forall \ (i\neq j),$

se poate afirma despre ele că sunt necorelate. Rezultă din ecuația combinațiilor liniare că dacă variabilele aleatoare $X_{1},\dots ,X_{N}$ sunt necorelate, varianța sumei lor este egală cu suma varianțelor lor:

$\operatorname {Var} \left(\sum _{i=1}^{N}X_{i}\right)=\sum _{i=1}^{N}\operatorname {Var} (X_{i}).$

Deoarece variabilele aleatoare independente sunt mereu necorelate, ecuația de mai sus este valabilă doar când variabilele aleatoare $X_{1},\dots ,X_{n}$ sunt independente. Prin urmare, independența este o condiție suficientă, dar nu și necesară, pentru ca varianța sumei să fie egală cu suma varianțelor (i.e. ecuația de mai sus să fie adevărată).

Suma variabilelor necorelate (formula lui Bienaymé)

Unul din motivele pentru care varianța este preferată altor măsuri de dispersie este că varianța sumei variabilelor aleatoare necorelate este egală cu suma varianțelor lor:

$\operatorname {Var} \left(\sum _{i=1}^{n}X_{i}\right)=\sum _{i=1}^{n}\operatorname {Var} (X_{i}).$

Această ecuația se numește "formula lui Bienaymé"^[2], fiind descoperită în 1853.^[3] ^[4] Deseori presupune condiția ca variabilele să fie independente, deși simpla lipsă de corelare este suficientă. Deci, dacă toate variabilele au aceeași varianță σ², atunci, deoarece împărțirea cu n este o transformare liniară, formula varianței mediei lor devine:

$\operatorname {Var} \left({\overline {X}}\right)=\operatorname {Var} \left({\frac {1}{n}}\sum _{i=1}^{n}X_{i}\right)={\frac {1}{n^{2}}}\sum _{i=1}^{n}\operatorname {Var} \left(X_{i}\right)={\frac {1}{n^{2}}}n\sigma ^{2}={\frac {\sigma ^{2}}{n}}.$

Aceasta înseamnă că varianța mediei scade atunci când n crește. Această formulă pentru varianța mediei este utilizată în definirea erorii standard a mediei eșantionului, care este utilizată in teorema limitei centrale.

Pentru demonstrarea formulei lui Bienaymé, este suficient să se arate că:

$\operatorname {Var} (X+Y)=\operatorname {Var} (X)+\operatorname {Var} (Y).$

Această formulă poate fi demonstrată prin inducție, pornindu-se de la definiția varianței:

${\begin{aligned}\operatorname {Var} (X+Y)&=\operatorname {E} [(X+Y)^{2}]-(\operatorname {E} [X+Y])^{2}\\[5pt]&=\operatorname {E} [X^{2}+2XY+Y^{2}]-(\operatorname {E} [X]+\operatorname {E} [Y])^{2}.\end{aligned}}$

Folosind proprietatea de liniaritate a speranței matematicii (i.e. mediei) și ipoteza independenței variabilelor (sau, cel puțin, a lipsei de corelare) X și Y, ecuația de mai sus se poate dezvolta în felul următor:

${\begin{aligned}\operatorname {Var} (X+Y)&=\operatorname {E} [X^{2}]+2\operatorname {E} [XY]+\operatorname {E} [Y^{2}]-(\operatorname {E} [X]^{2}+2\operatorname {E} [X]\operatorname {E} [Y]+\operatorname {E} [Y]^{2})\\[5pt]&=\operatorname {E} [X^{2}]+\operatorname {E} [Y^{2}]-\operatorname {E} [X]^{2}-\operatorname {E} [Y]^{2}\\[5pt]&=\operatorname {Var} (X)+\operatorname {Var} (Y).\end{aligned}}$

Suma variabilelor corelate

În general, dacă variabilele sunt corelate, atunci varianța sumei lor este egală cu suma covarianțelor lor:

$\operatorname {Var} \left(\sum _{i=1}^{n}X_{i}\right)=\sum _{i=1}^{n}\sum _{j=1}^{n}\operatorname {Cov} (X_{i},X_{j})=\sum _{i=1}^{n}\operatorname {Var} (X_{i})+2\sum _{1\leq i<j\leq n}\operatorname {Cov} (X_{i},X_{j}).$

(Notă: A doua egalitate se datorează faptului că $Cov(X i, X i) = Var(X i)$ )

Aici $Cov(\cdot, \cdot)$ reprezintă covarianța, care este zero pentru variabilele aleatoare independente. Formula stipulează că varianța sumei de variabile este egală cu suma tuturor elementelor din matricea de covarianță a variabilelor componente. Următoarea expresie stipulează, în mod echivalent, că varianța sumei de variabile este suma elementelor diagonalei matricei covarianțelor plus de două ori suma elementelor de deasupra diagonalei matricei. Datorită faptului că matricea de covarianță este simetrică, se pot lua în locul elementelor de deasupra diagonalei, elementele de dedesubtul diagonalei. Această formulă se folosește în teoria coeficientului Alpha a lui Cronbach, aceasta fiind esențială în teoria clasică a testării.

Deci dacă variabilele au varianțele egale cu σ ² și corelația medie a variabilelor este ρ, atunci varianța mediei lor este:

$\operatorname {Var} ({\overline {X}})={\frac {\sigma ^{2}}{n}}+{\frac {n-1}{n}}\rho \sigma ^{2}.$

Aceasta implică faptul că varianța mediei crește cu media corelațiilor. Cu alte cuvine, observațiile adiționale corelate nu sunt la fel de efective în reducerea incertitudinii mediei, precum sunt observațiile adiționale independente. Mai mult, dacă variabilele au varianța egală cu 1, în cazul standardizării spre exemplu, formula se simplifică:

$\operatorname {Var} ({\overline {X}})={\frac {1}{n}}+{\frac {n-1}{n}}\rho .$

Această formulă este încorporată în formula de predicție Spearman-Brown a teoriei clasice a testării. Aceasta converge la ρ dacă n tinde la infinit, presupunând că corelația medie rămâne constantă sau converge de asemenea. Încât, pentru varianța mediei variabilelor standardizate cu corelații constante sau având corelația medie convergentă, obținem:

$\lim _{n\to \infty }\operatorname {Var} ({\overline {X}})=\rho .$

În concluzie, varianța mediei unui număr mare de variabile standardizate este aproximativ egală cu corelația lor medie. Aceasta înseamnă că media variabilelor corelate ale eșantionului nu converge, în general, la media populației, deși legea numerelor mari stipulează că media eșantionului va converge la media populației dacă variabilele sunt independente.

Notația matricială pentru varianța unei combinații liniare

Fie $X$ un vector coloană cu $n$ variabile aleatoare < $X_{1},\ldots ,X_{n}$ , și $c$ un vector coloană cu $n$ scalari $c_{1},\ldots ,c_{n}$ . Prin urmare, $c^{T}X$ reprezintă o combinație liniară a acestor variabile aleatoare, unde prin $c^{T}$ este notată transpusa matricei c. De asemenea, fie $\Sigma$ matricea covarianței lui $X$ . Varianța lui $c^{T}X$ este dată de: ^[5]

$\operatorname {Var} (c^{T}X)=c^{T}\Sigma c.$

Sumă ponderată de variabile

Proprietatea de scalare, formula lui Bienaymé, împreună cu proprietatea covarianței $Cov(aX, bY) = ab Cov(X, Y)$ , implică următoarea expresie:

$\operatorname {Var} (aX\pm bY)=a^{2}\operatorname {Var} (X)+b^{2}\operatorname {Var} (Y)\pm 2ab\,\operatorname {Cov} (X,Y).$

Din cele de mai sus rezultă că efectul ponderării variabilelor (coeficienții a și b) este disproporționat pentru calcularea varianței. Spre exemplu, presupunând că variabilele X și Y sunt necorelate, iar ponderea lui X este de două ori mai mare decât ponderea lui Y (i.e. a = 2b), atunci ponderea lui X în formula varianței va fi de patru ori mai mare decât ponderea lui Y.

Varianța ponderată a n variabile poate fi scrisă ca:

$\operatorname {Var} \left(\sum _{i}^{n}a_{i}X_{i}\right)=\sum _{i=1}^{n}a_{i}^{2}\operatorname {Var} (X_{i})+2\sum _{1\leq i}\sum _{<j\leq n}a_{i}a_{j}\operatorname {Cov} (X_{i},X_{j})$

Produs de variabile independente

Dacă două variabile X și Y sunt independente, varianța produsului lor este dată de ^[6]

${\begin{aligned}\operatorname {Var} (XY)&=[\operatorname {E} (X)]^{2}\operatorname {Var} (Y)+[\operatorname {E} (Y)]^{2}\operatorname {Var} (X)+\operatorname {Var} (X)\operatorname {Var} (Y).\end{aligned}}$

Prin manipulări, ecuația poate fi transformată la:

$\operatorname {Var} (XY)=\operatorname {E} (X^{2})\operatorname {E} (Y^{2})-[\operatorname {E} (X)]^{2}[\operatorname {E} (Y)]^{2}.$

Produs de variabile dependente statistic

În general, dacă două variabile sunt dependente statistic, varianța produsului lor este dată de următoarea formulă:

${\begin{aligned}\operatorname {Var} (XY)={}&\operatorname {E} [X^{2}Y^{2}]-[\operatorname {E} (XY)]^{2}\\[5pt]={}&\operatorname {Cov} (X^{2},Y^{2})+\operatorname {E} (X^{2})\operatorname {E} (Y^{2})-[\operatorname {E} (XY)]^{2}\\[5pt]={}&\operatorname {Cov} (X^{2},Y^{2})+(\operatorname {Var} (X)+[\operatorname {E} (X)]^{2})(\operatorname {Var} (Y)+[\operatorname {E} (Y)]^{2})\\[5pt]&{}-[\operatorname {Cov} (X,Y)+\operatorname {E} (X)\operatorname {E} (Y)]^{2}\end{aligned}}$

Descompunere

Formula generală pentru descompunerea varianței, sau legea varianței totale, unde $X$ și $Y$ sunt două variabile aleatoare, iar varianța lui $X$ există, este:

$\operatorname {Var} [X]=\operatorname {E} (\operatorname {Var} [X\mid Y])+\operatorname {Var} (\operatorname {E} [X\mid Y]).$

Speranța matematică (i.e. media condiționată) a lui $X$ dat fiind $Y$ , și varianța condiționată $\operatorname {Var} (X\mid Y)$ pot fi înțelese în felul următor: dată fiind o valoare particulară y a variabilei aleatoare Y, există o speranță matematică $\operatorname {E} (X\mid Y=y)$ când Y=y. Această cantitate depinde de valoarea specifică y, fiind o funcție $g(y)=\operatorname {E} (X\mid Y=y)$ . Aceeași funcție evaluată pentru variabila aleatoare Y reprezintă speranța matematică (i.e. media condiționată) $\operatorname {E} (X\mid Y)=g(Y).$

În particular, dacă $Y$ este o variabilă aleatoare discretă ce ia valori $y_{1},y_{2},y_{3}\ldots$ cu probabilitățile corespunzătoare $p_{1},p_{2},p_{3}\ldots ,$ , atunci formula pentru varianța totală este:

$\operatorname {E} (\operatorname {Var} [X\mid Y])=\sum _{i}p_{i}\sigma _{i}^{2},$

unde $\sigma _{i}^{2}=\operatorname {Var} [X\mid Y=y_{i}]$ . În mod similar, varianța mediei (al doilea termen al formulei generale) devine:

$\operatorname {Var} (\operatorname {E} [X\mid Y])=\sum _{i}p_{i}\mu _{i}^{2}-\left(\sum _{i}p_{i}\mu _{i}\right)^{2}=\sum _{i}p_{i}\mu _{i}^{2}-\mu ^{2},$

unde $\mu _{i}=\operatorname {E} [X\mid Y=y_{i}]$ și $\mu =\sum _{i}p_{i}\mu _{i}$ . Astfel, formula varianței total devine:

$\operatorname {Var} [X]=\sum _{i}p_{i}\sigma _{i}^{2}+\left(\sum _{i}p_{i}\mu _{i}^{2}-\mu ^{2}\right).$

O formulă similară este folosită în procesul de analiză a varianței (i.e. ANOVA):

${\mathit {MS}}_{\text{total}}={\mathit {MS}}_{\text{between}}+{\mathit {MS}}_{\text{within}};$

unde ${\mathit {MS}}$ semnifică media pătratelor (engl. “mean of the squares”). În cazul regresiei liniare, formula devine:

${\mathit {MS}}_{\text{total}}={\mathit {MS}}_{\text{regression}}+{\mathit {MS}}_{\text{residual}}.$

Această formulă poate fi derivată și din proprietatea de aditivitate a varianțelor, de vreme ce varianță totală (observată) este egală cu suma dintre varianță prognozată și varianță reziduală (i.e. eroarea de prognoză), cele două fiind necorelate.

Descompuneri similare sunt posibile pentru suma deviațiilor pătratice ${\mathit {SS}}$ :

${\mathit {SS}}_{\text{total}}={\mathit {SS}}_{\text{between}}+{\mathit {SS}}_{\text{within}},$ ${\mathit {SS}}_{\text{total}}={\mathit {SS}}_{\text{regression}}+{\mathit {SS}}_{\text{residual}}.$

Proprietate caracteristică

Al doilea moment al unei variabile aleatoare atinge valoarea minimă când este luat în jurul primului moment (care este media) al variabilei aleatoare, i.e. $\mathrm {argmin} _{m}\,\mathrm {E} \left(\left(X-m\right)^{2}\right)=\mathrm {E} (X)$ . Invers, dacă o funcție continuă $\varphi$ satisface $\mathrm {argmin} _{m}\,\mathrm {E} (\varphi (X-m))=\mathrm {E} (X)$ pentru toate variabilele aleatoare X, atunci este neapărat de forma $\varphi (x)=ax^{2}+b$ , unde a>0. Aceasta rămâne valabil și în cazul multidimensionalității. ^[7]

Unități de măsură

Spre deosebire de speranța matematică a deviației absolute, unitatea de măsură a varianței este pătratul unității variabilei. Spre exemplu, o variabilă având unitatea de măsură în metri, va avea varianța măsurată în metri pătrați. Din acest motiv, descrierea unei mulțimi cu ajutorul deviației standard sau a rădăcinii deviației pătratice medii este deseori preferată în locul varianței. În problema aruncării cu zarul, prezentată mai sus, deviația standard este √2,9 ≈ 1,7 - puțin mai mare decât speranță matematică a deviației absolute care este 1.5.

Atât deviația standard, cât și speranța matematică a deviației absolute, pot fi folosite pentru a indica “împrăștierea” unei distribuții. Deviația standard este mai convenabilă manipulărilor algebrice decât speranța matematică a deviației absolute, ambele fiind folosite frecvent, alături de varianță și covarianță, în știința statisticii. Totuși, speranța matematică a deviației absolute tinde să fie mai robustă față de valorile extreme (datorate erorilor de măsurare sau specificității distribuției).

Aproximarea varianței unei funcții

Metoda delta folosește seriile Taylor de ordinul doi pentru a aproxima varianța unei funcții de una sau mai multe variabile aleatoare. Spre exemplu, aproximarea varianței unei funcții de o variabilă este dată de formula:

$\operatorname {Var} \left[f(X)\right]\approx \left(f'(\operatorname {E} \left[X\right])\right)^{2}\operatorname {Var} \left[X\right]$

presupunând că f este dublu diferențiabilă și că media și varianța lui X sunt finite. Pentru mai multe detalii, vezi seria Taylor pentru momentele funcțiilor de variabile aleatoare.

Varianța unei populații și varianța unui eșantion

Observațiile din natură, precum cele privitoare la cantitatea zilnică de precipitații, nu pot fi considerate a fi complete deoarece nu putem înregistra toate fenomenele similare petrecute de la începutul timpului (i.e. toate zilele cu precipitații de la începutul existenței Pământului). Prin urmare, varianța calculată dintr-o mulțime de observații limitate (în timp sau spațiu), nu poate fi egală cu varianța ce ar fi rezultat dacă am fi avut mulțimea exhaustivă de observații (i.e. nelimitate de timp sau spațiu). Aceasta înseamnă că va trebui să estimăm media și varianța mulțimii exhaustive de observații (i.e. a populației) folosind o ecuație estimatoare. Ecuația estimatoare este o funcție de n observații ale unui eșantion extras, fără erori de eșantionare, din întreaga populație de observații posibile.

Cei mai simplii estimatori pentru media și varianța unei populații sunt media și varianța eșantionului, aceștia fiind estimatori consistenți (i.e. converg la valoarea reală odată cu creșterea numărului de eșantioane). Totuși, estimarea varianței eșantionului poate fi îmbunătățită în mai multe feluri. În acest sens, se pot folosi divizori diferiți de n pentru deviațiile pătratice. Ceilalți trei divizori folosiți sunt: n-1, n+1 și n-1,5. Se consideră că n-1 elimină alterarea, n+1 minimizează eroarea pătratică medie pentru distribuția normală, și n – 1,5 elimină alterarea estimatorului deviației standard pentru distribuția normală.

Dacă media populației este necunoscută, fiind calculată pe baza eșantionului, atunci varianța eșantionului este un estimator alterat datorită subestimării varianței cu un factor de (n-1)/n; corectând estimarea cu acest factor (și deci împărțind deviațiile pătratice cu n-1 în loc de n), se numește corecția lui Bessel. Estimatorul rezultat este nealterat, numindu-se varianța corectată a eșantionului sau varianța nealterată a eșantionului. Spre exemplu, dacă avem o singură observație într-un eșantion (i.e. media în sine), varianța eșantionului este evident zero, indiferent de varianța reală a populației. Acest fapt nu ar mai fi valabil dacă s-ar cunoaște media populației (sau ar putea fi estimată dintr-un alt eșantion decât cel din care este estimată varianța), caz în care varianța poate fi estimată prin împărțire la n. În exemplul cu o singură observație, varianța ar fi egală cu deviația pătratică a observației de la media (estimată a) populației.

Pe de altă parte, varianța eșantionului nu minimizează eroarea pătratică medie între varianța eșantionului și varianța populației. Folosind corecția lui Bessel înrăutățește estimarea erorii pătratice medii. De aceea, în acest caz se folosește un factor de scalare (i.e. de proporționare) mai mare decat (n-1), împărțindu-se varianța eșantionului, în cazul distribuției normale, la (n+1) pentru a minimiza eroarea pătratică medie. În acest caz folosim totuși o variație alterată a eșantionului.

Varianța populației

În general, varianța unei populații finite de mărime N, cu valori x_i este dată de:

${\begin{aligned}\sigma ^{2}&={\frac {1}{N}}\sum _{i=1}^{N}\left(x_{i}-\mu \right)^{2}={\frac {1}{N}}\sum _{i=1}^{N}\left(x_{i}^{2}-2\mu x_{i}+\mu ^{2}\right)\\[5pt]&=\left({\frac {1}{N}}\sum _{i=1}^{N}x_{i}^{2}\right)-2\mu \left({\frac {1}{N}}\sum _{i=1}^{N}x_{i}\right)+\mu ^{2}\\[5pt]&=\left({\frac {1}{N}}\sum _{i=1}^{N}x_{i}^{2}\right)-\mu ^{2}\end{aligned}}$

unde media populației este:

$\mu ={\frac {1}{N}}\sum _{i=1}^{N}x_{i}.$

Varianța populației poate fi calculată și folosind următoarea formulă:

$\sigma ^{2}={\frac {1}{N^{2}}}\sum _{i<j}\left(x_{i}-x_{j}\right)^{2}={\frac {1}{2N^{2}}}\sum _{i,j=1}^{N}\left(x_{i}-x_{j}\right)^{2}.$

Aceasta este validă, deoarece:

${\begin{aligned}{\frac {1}{2N^{2}}}\sum _{i,j=1}^{N}\left(x_{i}-x_{j}\right)^{2}&={\frac {1}{2N^{2}}}\sum _{i,j=1}^{N}\left(x_{i}^{2}-2x_{i}x_{j}+x_{j}^{2}\right)\\[5pt]&={\frac {1}{2N}}\sum _{j=1}^{N}\left({\frac {1}{N}}\sum _{i=1}^{N}x_{i}^{2}\right)-\left({\frac {1}{N}}\sum _{i=1}^{N}x_{i}\right)\left({\frac {1}{N}}\sum _{j=1}^{N}x_{j}\right)\\[5pt]&\quad +{\frac {1}{2N}}\sum _{i=1}^{N}\left({\frac {1}{N}}\sum _{j=1}^{N}x_{j}^{2}\right)\\[5pt]&={\frac {1}{2}}\left(\sigma ^{2}+\mu ^{2}\right)-\mu ^{2}+{\frac {1}{2}}\left(\sigma ^{2}+\mu ^{2}\right)\\[5pt]&=\sigma ^{2}\end{aligned}}$

Varianța populației corespunde varianței disitributiei de probabilitate aferente, de aceea conceptul de populație poate fi extins pentru distribuții de probabilitate continue, având mărimi infinite. .

Varianța eșantionului

În multe situații practice, varianța populației nu poate fi cunoscută a priori, trebuind a fi estimată prin alegerea unui eșantion.^[8] Ca și în cazul varianței populației, varianța eșantionului poate fi calculată și pentru o distribuție continuă aferentă distribuției populației.

Fie un eșantion cu n valori Y ₁ , . . .,Y _n extras dintr-o anumită populație N, unde n < N. ^[9] Atunci varianța eșantionului este dată de media deviațiilor pătratice:

$\sigma _{y}^{2}={\frac {1}{n}}\sum _{i=1}^{n}\left(Y_{i}-{\overline {Y}}\right)^{2}=\left({\frac {1}{n}}\sum _{i=1}^{n}Y_{i}^{2}\right)-{\overline {Y}}^{2}={\frac {1}{n^{2}}}\sum _{i,j\,:\,i<j}\left(Y_{i}-Y_{j}\right)^{2}.$

Aici, ${\overline {Y}}$ denotă media eșantionului:

${\overline {Y}}={\frac {1}{n}}\sum _{i=1}^{n}Y_{i}.$

Deoarece Y_i au fost selectate aleatoriu, atât ${\overline {Y}}$ cât și < $\sigma _{Y}^{2}$ sunt variabile aleatoare. Speranța lor matematică poate fi evaluată prin luarea mediei estimatorilor aferenți tuturor eșantioanelor posibile { Y_i} de mărime n din populație. Așa încât, pentru $\sigma _{Y}^{2}$ avem:

${\begin{aligned}\operatorname {E} [\sigma _{Y}^{2}]&=\operatorname {E} \left[{\frac {1}{n}}\sum _{i=1}^{n}\left(Y_{i}-{\frac {1}{n}}\sum _{j=1}^{n}Y_{j}\right)^{2}\right]\\[5pt]&={\frac {1}{n}}\sum _{i=1}^{n}\operatorname {E} \left[Y_{i}^{2}-{\frac {2}{n}}Y_{i}\sum _{j=1}^{n}Y_{j}+{\frac {1}{n^{2}}}\sum _{j=1}^{n}Y_{j}\sum _{k=1}^{n}Y_{k}\right]\\[5pt]&={\frac {1}{n}}\sum _{i=1}^{n}\left[{\frac {n-2}{n}}\operatorname {E} [Y_{i}^{2}]-{\frac {2}{n}}\sum _{j\neq i}\operatorname {E} [Y_{i}Y_{j}]+{\frac {1}{n^{2}}}\sum _{j=1}^{n}\sum _{k\neq j}^{n}\operatorname {E} [Y_{j}Y_{k}]+{\frac {1}{n^{2}}}\sum _{j=1}^{n}\operatorname {E} [Y_{j}^{2}]\right]\\[5pt]&={\frac {1}{n}}\sum _{i=1}^{n}\left[{\frac {n-2}{n}}(\sigma ^{2}+\mu ^{2})-{\frac {2}{n}}(n-1)\mu ^{2}+{\frac {1}{n^{2}}}n(n-1)\mu ^{2}+{\frac {1}{n}}(\sigma ^{2}+\mu ^{2})\right]\\[5pt]&={\frac {n-1}{n}}\sigma ^{2}.\end{aligned}}$

Prin urmare $\sigma _{Y}^{2}$ este o estimare a varianței populației ce este alterată cu un factor de ${\frac {n-1}{n}}$ . Din acest motiv, $\sigma _{Y}^{2}$ se numește varianța alterată a eșantionului. Corectând această alterație, obținem varianța nealterată a eșantionului:

$s^{2}={\frac {n}{n-1}}\sigma _{Y}^{2}={\frac {n}{n-1}}\left({\frac {1}{n}}\sum _{i=1}^{n}\left(Y_{i}-{\overline {Y}}\right)^{2}\right)={\frac {1}{n-1}}\sum _{i=1}^{n}\left(Y_{i}-{\overline {Y}}\right)^{2}$

Corecția Bassel (n-1) se folosește și în calcularea covarianței eșantionului și a deviației standard a eșantionului (i.e. rădăcina pătrată a varianței). Rădăcina pătrată este o funcție concavă, introducând astfel alterația negativă (conform inegalității lui Jensen), ceea ce, depinzând de distribuție, face ca deviația standard folosind corecția Basel să fie alterată în acest caz. Estimarea deviației standard nealterate este o problemă tehnică complicată, deși pentru distribuția normală se poate folosi divizorul (n -1,5) din care rezultă un estimator al deviației standard aproape nealterat. .

Distribuția varianței eșantionului

Distribuția de probabilitate și distribuția cumulativă a lui S²/σ², pentru diferite valori ale lui ν = n − 1, când y_i sunt independente și normal distribuite.

Fiind o funcție de variabile aleatoare, varianța eșantionului este ea însăși o variabilă aleatoare, fiind astfel justificat să-i studiem distribuția. În cazul în care Y_i sunt observații independente ale unei distribuții normale, teorema lui Cochran arată că S² se conformează unei distribuții chi-pătrat : ^[10]

$(n-1){\frac {S^{2}}{\sigma ^{2}}}\sim \chi _{n-1}^{2}.$

O consecință directă a acestui fapt este că:

$\operatorname {E} (S^{2})=\operatorname {E} \left({\frac {\sigma ^{2}}{n-1}}\chi _{n-1}^{2}\right)=\sigma ^{2},$

și ^[11]

$\operatorname {Var} [s^{2}]=\operatorname {Var} \left({\frac {\sigma ^{2}}{n-1}}\chi _{n-1}^{2}\right)={\frac {\sigma ^{4}}{(n-1)^{2}}}\operatorname {Var} \left(\chi _{n-1}^{2}\right)={\frac {2\sigma ^{4}}{n-1}}.$

Dacă valorile Y_i sunt independente și identic distribuite, dar nu necesar și normal distribuite, atunci:^[12] ^[13]

$\operatorname {E} [S^{2}]=\sigma ^{2},\quad \operatorname {Var} [S^{2}]={\frac {\sigma ^{4}}{n}}\left((\kappa -1)+{\frac {2}{n-1}}\right)={\frac {1}{n}}\left(\mu _{4}-{\frac {n-3}{n-1}}\sigma ^{4}\right),$

unde κ este aplatizarea (i.e. kurtotizarea) distribuției, iar μ₄ este al patrulea moment central.

Dacă legea numerelor mari este valabilă pentru observațiile pătratice, s² este un estimator consistent al σ^2. Poate fi demonstrat că varianța estimatorilor tinde asimptotic către zero. O formulă asimptotică echivalentă a fost dată în Kenney and Keeping (1951: 164), Rose and Smith (2002: 264), și Weisstein (n.d.). ^[14] ^[15] ^[16]

Inegalitatea lui Samuelson

Inegalitatea lui Samuelson este un rezultat care stipulează limite pentru valorile ce pot fi luate de observațiile individuale dintr-un eșantion, presupunând că acel eșantion are medie și varianță ^[17] Conform acesteia, valorile trebuie să fie cuprinse în intervalul: ${\bar {y}}\pm \sigma _{Y}(n-1)^{1/2}.$

Relații cu media armonică și media aritmetică

A fost arătat că pentru un eșantion ^[18] { y_i } de numere reale,

$\sigma _{y}^{2}\leq 2y_{\max }(A-H),$

unde y _max reprezintă valoarea maximă a eșantionului, A este media aritmetică, H este media armonică a eșantionului și $\sigma _{y}^{2}$ este varianța (alterată) a eșantionului.

Ulterior, acest interval a fost dezvoltat, încât s-a ajuns la următorul interval de mărginire a varianței:

$\sigma _{y}^{2}\leq {\frac {y_{\max }(A-H)(y_{\max }-A)}{y_{\max }-H}},$

$\sigma _{y}^{2}\geq {\frac {y_{\min }(A-H)(A-y_{\min })}{H-y_{\min }}},$

unde y _min este valoarea minimă a eșantionului. ^[19]

Istorie

Termenul de varianță a fost introdus prima dată de Ronald Fisher într-un articol din 1918 intitulat The Correlation Between Relatives on the Supposition of Mendelian Inheritance: ^[20]

Marea literatură statistică ne arată cum deviațiile măsurătorilor umane de la medie urmează îndeaproape Legea Normală a Erorilor, și, prin urmare, că variabilitatea poate fi măsurată uniform cu ajutorul deviației standard corespunzătoare rădăcinii pătratice a erorii pătratice medii. Când există două cauze independente cauzatoare de variabilitate într-o distribuție uniformă cu deviațiile standard $\sigma _{1}$ și $\sigma _{2}$ , se găsește că distribuția, atunci când cauzele acționează împreună, are o deviație standard de ${\sqrt {\sigma _{1}^{2}+\sigma _{2}^{2}}}$ . Este prin urmare de dorit în analizarea cauzelor variabilității să ne ocupăm de pătratul deviației standard ca măsură a variabilității. Vom numi această cantitate “varianță”...

Semivarianța

Semivarianța este calculată asemenea varianței, însă doar acele observații mai mici decât media sunt luate în considerare. Uneori este descrisă ca fiind riscul de pierderi într-un context investițional. Pentru distribuții asimetrice, semivarianța poate oferi informații adiționale pe care varianța le ignoră. ^{[necesită citare]}

Semivarianța poate fi folosită și pentru a determina intervalul de valori pe care o distribuție o poate lua în jurul mediei, conform inegalității lui Chebyshev.

Generalizări

Pentru variabile complexe

Dacă $x$ este o variabilă aleatoare complexă scalară, cu valori în $\mathbb {C} ,$ atunci varianța sa este $\operatorname {E} \left[(x-\mu )(x-\mu )^{*}\right],$ , unde $x^{*}$ este conjugata complexă a lui $x.$ . Această varianță este un scalar real.

Pentru variabile vectoriale aleatoare

Ca matrice

Dacă $X$ este un vector coloană ce cuprinde valori aleatoare, cu valori în $\mathbb {R} ^{n},$ , atunci o generalizare naturală a varianței este $\operatorname {E} \left[(X-\mu )(X-\mu )^{\operatorname {T} }\right],$ unde $X^{\operatorname {T} }$ este transpusa lui $X,$ , fiind astfel un vector linie. Rezultatul este o matrice pătratică semidefinită, cunoscută sub numele de matricea varianță-covarianță (sau, mai simplu, matricea covarianței).

Dacă $X$ este un vector coloană ce cuprinde valori aleatoare, cu valori în $\mathbb {C} ^{n},$ atunci matricea covarianței este $\operatorname {E} \left[(X-\mu )(X-\mu )^{\dagger }\right],$ , unde $X^{\dagger }$ este transpusa conjugată a lui $X.$ Și această matrice este pătratică și pozitiv semidefinită.

Ca scalar

O altă generalizare a varianței pentru valori vectoriale de variabile aleatoare $X,$ care rezultă într-o valoare scalară în loc de structură matriceală, este obținută prin interpretarea deviației dintre variabila aleatoare și media sa ca distanță Euclidiană. Rezultatul este că $\operatorname {E} \left[(X-\mu )^{\operatorname {T} }(X-\mu )\right]=\operatorname {tr} (C),$ ceea ce reprezintă o urmă matriceală a matricei covarianței.

Vezi și

Note

^ Yuli Zhang, Huaiyu Wu, Lei Cheng (iunie 2012). Some new deformation formulas about variance and covariance. Proceedings of 4th International Conference on Modelling, Identification and Control(ICMIC2012). pp. 987–992.
^ Loève, M. (1977) "Probability Theory", Graduate Texts in Mathematics, Volume 45, 4th edition, Springer-Verlag, p. 12.
^ Bienaymé, I.-J. (1853) "Considérations à l'appui de la découverte de Laplace sur la loi de probabilité dans la méthode des moindres carrés", Comptes rendus de l'Académie des sciences Paris, 37, p. 309–317; digital copy available [1]
^ Bienaymé, I.-J. (1867) "Considérations à l'appui de la découverte de Laplace sur la loi de probabilité dans la méthode des moindres carrés", Journal de Mathématiques Pures et Appliquées, Série 2, Tome 12, p. 158–167; digital copy available [2][3]
^ Johnson, Richard; Wichern, Dean (2001). Applied Multivariate Statistical Analysis. Prentice Hall. p. 76. ISBN 0-13-187715-1.
^ Goodman, Leo A. (decembrie 1960). „On the Exact Variance of Products”. Journal of the American Statistical Association. 55 (292): 708. doi:10.2307/2281592. JSTOR 2281592.
^ Kagan, A.; Shepp, L. A. (1998). „Why the variance?”. Statistics & Probability Letters. 38 (4): 329–333. doi:10.1016/S0167-7152(98)00041-8.
^ Navidi, William (2006) Statistics for Engineers and Scientists, McGraw-Hill, pg 14.
^ Montgomery, D. C. and Runger, G. C. (1994) Applied statistics and probability for engineers, page 201. John Wiley & Sons New York
^ Knight K. (2000), Mathematical Statistics, Chapman and Hall, New York. (proposition 2.11)
^ Casella and Berger (2002) Statistical Inference, Example 7.3.3, p. 331 ^{[referință neconformată]}
^ Cho, Eungchun; Cho, Moon Jung; Eltinge, John (2005) The Variance of Sample Variance From a Finite Population. International Journal of Pure and Applied Mathematics 21 (3): 387-394. http://www.ijpam.eu/contents/2005-21-3/10/10.pdf
^ Cho, Eungchun; Cho, Moon Jung (2009) Variance of Sample Variance With Replacement. International Journal of Pure and Applied Mathematics 52 (1): 43–47. http://www.ijpam.eu/contents/2009-52-1/5/5.pdf
^ Kenney, John F.; Keeping, E.S. (1951) Mathematics of Statistics. Part Two. 2nd ed. D. Van Nostrand Company, Inc. Princeton: New Jersey. http://krishikosh.egranth.ac.in/bitstream/1/2025521/1/G2257.pdf
^ Rose, Colin; Smith, Murray D. (2002) Mathematical Statistics with Mathematica. Springer-Verlag, New York. http://www.mathstatica.com/book/Mathematical_Statistics_with_Mathematica.pdf
^ Weisstein, Eric W. (n.d.) Sample Variance Distribution. MathWorld—A Wolfram Web Resource. http://mathworld.wolfram.com/SampleVarianceDistribution.html
^ Samuelson, Paul (1968). „How Deviant Can You Be?”. Journal of the American Statistical Association. 63 (324): 1522–1525. doi:10.1080/01621459.1968.10480944. JSTOR 2285901.
^ Mercer, A. McD. (2000). „Bounds for A–G, A–H, G–H, and a family of inequalities of Ky Fan's type, using a general method”. J. Math. Anal. Appl. 243 (1): 163–173. doi:10.1006/jmaa.1999.6688.
^ Sharma, R. (2008). „Some more inequalities for arithmetic mean, harmonic mean and variance”. J. Math. Inequalities. 2 (1): 109–114. doi:10.7153/jmi-02-11.
^ Ronald Fisher (1918) The correlation between relatives on the supposition of Mendelian Inheritance

[1] Yuli Zhang, Huaiyu Wu, Lei Cheng (iunie 2012). Some new deformation formulas about variance and covariance. Proceedings of 4th International Conference on Modelling, Identification and Control(ICMIC2012). pp. 987–992.

[2] Loève, M. (1977) "Probability Theory", Graduate Texts in Mathematics, Volume 45, 4th edition, Springer-Verlag, p. 12.

[3] Bienaymé, I.-J. (1853) "Considérations à l'appui de la découverte de Laplace sur la loi de probabilité dans la méthode des moindres carrés", Comptes rendus de l'Académie des sciences Paris, 37, p. 309–317; digital copy available [1]

[4] Bienaymé, I.-J. (1867) "Considérations à l'appui de la découverte de Laplace sur la loi de probabilité dans la méthode des moindres carrés", Journal de Mathématiques Pures et Appliquées, Série 2, Tome 12, p. 158–167; digital copy available [2][3]

[5] Johnson, Richard; Wichern, Dean (2001). Applied Multivariate Statistical Analysis. Prentice Hall. p. 76. ISBN 0-13-187715-1.

[6] Goodman, Leo A. (decembrie 1960). „On the Exact Variance of Products”. Journal of the American Statistical Association. 55 (292): 708. doi:10.2307/2281592. JSTOR 2281592.

[7] Kagan, A.; Shepp, L. A. (1998). „Why the variance?”. Statistics & Probability Letters. 38 (4): 329–333. doi:10.1016/S0167-7152(98)00041-8.

[8] Navidi, William (2006) Statistics for Engineers and Scientists, McGraw-Hill, pg 14.

[9] Montgomery, D. C. and Runger, G. C. (1994) Applied statistics and probability for engineers, page 201. John Wiley & Sons New York

[10] Knight K. (2000), Mathematical Statistics, Chapman and Hall, New York. (proposition 2.11)

[11] Casella and Berger (2002) Statistical Inference, Example 7.3.3, p. 331 ^{[referință neconformată]}

[12] Cho, Eungchun; Cho, Moon Jung; Eltinge, John (2005) The Variance of Sample Variance From a Finite Population. International Journal of Pure and Applied Mathematics 21 (3): 387-394. http://www.ijpam.eu/contents/2005-21-3/10/10.pdf

[13] Cho, Eungchun; Cho, Moon Jung (2009) Variance of Sample Variance With Replacement. International Journal of Pure and Applied Mathematics 52 (1): 43–47. http://www.ijpam.eu/contents/2009-52-1/5/5.pdf

[14] Kenney, John F.; Keeping, E.S. (1951) Mathematics of Statistics. Part Two. 2nd ed. D. Van Nostrand Company, Inc. Princeton: New Jersey. http://krishikosh.egranth.ac.in/bitstream/1/2025521/1/G2257.pdf

[15] Rose, Colin; Smith, Murray D. (2002) Mathematical Statistics with Mathematica. Springer-Verlag, New York. http://www.mathstatica.com/book/Mathematical_Statistics_with_Mathematica.pdf

[16] Weisstein, Eric W. (n.d.) Sample Variance Distribution. MathWorld—A Wolfram Web Resource. http://mathworld.wolfram.com/SampleVarianceDistribution.html

[17] Samuelson, Paul (1968). „How Deviant Can You Be?”. Journal of the American Statistical Association. 63 (324): 1522–1525. doi:10.1080/01621459.1968.10480944. JSTOR 2285901.

[18] Mercer, A. McD. (2000). „Bounds for A–G, A–H, G–H, and a family of inequalities of Ky Fan's type, using a general method”. J. Math. Anal. Appl. 243 (1): 163–173. doi:10.1006/jmaa.1999.6688.

[Sharma2008-19] Sharma, R. (2008). „Some more inequalities for arithmetic mean, harmonic mean and variance”. J. Math. Inequalities. 2 (1): 109–114. doi:10.7153/jmi-02-11.

[20] Ronald Fisher (1918) The correlation between relatives on the supposition of Mendelian Inheritance

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[20]