Sari la conținut

Statistică

De la Wikipedia, enciclopedia liberă

Statistica este o știință care, folosind calculul probabilităților, studiază fenomenele și procesele de tip colectiv (din societate, natură etc.) din punct de vedere cantitativ[1][2] în scopul descrierii acestora și al descoperirii legilor care guvernează manifestarea lor.

Statistica se ocupă de obținerea de informații relevante din datele disponibile într-un volum suficient de mare. Informațiile pot fi folosite pentru a înțelege datele disponibile (statistică descriptivă) sau pentru a descoperi noi informații despre evenimente și relațiile dintre ele (statistică inferențială).

Procesul de obținere a informației din date se numește inferență statistică referitoare la unii parametri statistici, sau chiar întregi distribuții probabilistice. Acesta este punctul de vedere mai general adoptat de teoria neparametrică în statistică. În statistica aplicată clasică este preferată ideea de a construi un model statistic cu care se pot face inferențe; în majoritatea cazurilor acest model nu este verificat, ceea ce poate conduce la concluzii eronate. Statistica aplicată modernă analizează însă date mult prea complexe, cum ar fi imagini sau structura proteinelor, pentru a se putea mărgini la ideea de modelare.

Statistica oferă suport pentru fizică, biologie, psihologie, economie, sociologie etc. Statistica excelează atunci când relațiile deterministe referitoare la evenimentul studiat sunt imposibil ori foarte dificil de aflat.

Pe teritoriul României lucrarea lui Dimitrie Cantemir "Descriptio Moldaviae" (1716) poate fi considerată ca o primă lucrare de statistică. Ea a fost scrisă la cererea Academiei din Berlin și conține toate cunoștințele acumulate în domeniu până la acea dată.

Statistica este considerată, pe de o parte, o parte matematică a științei ce se referă la colectarea, interpretarea sau explicarea și prezentarea datelor [3] și pe de altă parte o ramură a matematicii [4] ce se ocupă cu colectarea și interpretarea datelor. Datorită rădăcinilor ei empirice și a accentului pe aplicații, statistica este considerată cel mai adesea o știinta matematică distinctă mai degrabă decât o ramură a matematicii [5][6]. O mare parte a statisticii care asigură colectarea datelor este luată în considerare într-un mod care produce concluzii valide; codarea și arhivarea datelor pentru a reține informațiile; raportarea rezultatelor si rezumarea lor (tabele și grafice) într-un mod inteligibil celor care trebuie să le folosească.

Statisticienii îmbunătațesc calitatea datelor dezvoltând experimente și studiul prelevarii probelor. Statistica oferă, de asemenea, instrumente pentru prezicerea utilizării datelor și modelelor statistice. Statistica este aplicabilă unei vaste varietăți de discipline academice, incluzând științe naturale și sociale, guvern și afaceri. Consultanții în statistică ajută organizații și companii care nu dispun de expertiza "in-house" relevantă întrebărilor specifice companiilor sau organizațiilor.

"Statistica aplicată" cuprinde statistica descriptivă și statistica dedusă [7]. Statistica teoretică se preocupă cu argumentele logice ce subliniază justificarea abordărilor asupra statisticii deduse.

Pentru a aplica statistica unei probleme știintifice, industriale sau sociale este necesar să se înceapă cu un proces sau o populație de studiat. Populațiile pot avea teme diverse cum ar fi "toate persoanele care trăiesc într-o țară" sau "fiecare atom cuprins într-un cristal". O populație poate fi, de asemenea, compusă din observațiile unui proces la diferiți timpi, fiecare informație din observații folosind drept un număr diferit al grupului în totalitate. Informațiile colectate despre acest tip de "populații" constituie ceea ce se numește serii de timpi.

Din motive practice, un subset al populației ales numit probă este studiat. Odată ce o probă reprezentativă a populației este determinată, informațiile sunt colectate. Aceste date sunt apoi subiectul unor analize statistice, având ca scop descrierea si deducerea lor.

  • Statistica descriptivă rezumă datele populației, descriind ce a fost observat în probă, numeric sau grafic. Descriptorii numerici includ media si deviația standard pentru tipuri de distribuție continuă a probabilității (ca înalțime sau greutate), în timp ce frecvența și procentul sunt mult mai utile din punct de vedere al descrierii datelor categorice.
  • Statistica deductivă utilizează modele în datele probă pentru a extrage deducții despre populația reprezentată. Aceste deducții pot lua formă de: răspunsuri da/nu la întrebări despre date (testarea ipotezei, estimarea caracteristicilor numerice ale datelor (estimare), descrierea (asocieri) între date (corelare) si modelarea relațiilor între date[8].

Conceptul de corelare este de notat, în mod special, pentru aptitudinea de a crea confuzie. Analiza statistică a unui set de date adesea descoperă că două variabile (proprietăți) ale unei populații au tendința de a varia împreună, de parcă ar fi fost relevante una alteia. Un studiu de venit anual care se uită și la vârsta de deces ar putea arăta că oamenii săraci au tendința să trăiască mai puțin decât oamenii cu o stare financiară mai bună. Se presupune că cele două variabile sunt legate; cu toate acestea nu sunt cauza uneia sau celeilalte. Fenomenul de corelare poate fi cauzat de un al treilea fenomen, neconsiderat anterior, numit variabila spectator. Din acest motiv nu există un mod imediat de a deduce existența unei relații între două variabile.

  1. ^ Academia RPR Dicționar Enciclopedic Român, București: Editura Politică, 1962-1966
  2. ^ Academia Română, Institutul de Lingvistică Iorgu Iordan Dicționarul explicativ al limbii române (DEX), București: Editura Univers Enciclopedic, 1998
  3. ^ Moses, Lincoln E. (1986) Think and Explain with Statistics, Addison-Wesley, ISBN 978-0-201-15619-5 . pp. 1–3
  4. ^ Hays, William Lee, (1973) Statistics for the Social Sciences, Holt, Rinehart and Winston, p.xii, ISBN 978-0-03-077945-9
  5. ^ Moore, David (). „Teaching Statistics as a Respectable Subject”. În F. Gordon and S. Gordon. Statistics for the Twenty-First Century. Washington, DC: The Mathematical Association of America. pp. 14–25. ISBN 978-0-88385-078-7. 
  6. ^ Chance, Beth L. (). „Preface”. Investigating Statistical Concepts, Applications, and Methods (PDF). Duxbury Press. ISBN 978-0-495-05064-3. 
  7. ^ Anderson, D.R.; Sweeney, D.J.; Williams, T.A.. (1994) Introduction to Statistics: Concepts and Applications, pp. 5–9. West Group. ISBN 978-0-314-03309-3
  8. ^ Breiman, Leo (). „Statistical Modelling: the two cultures”. Statistical Science. 16 (3): 199–231. doi:10.1214/ss/1009213726. MR 1874152. Format:Citeseerx. 
  • M. Popa, „Statistica pentru psihologie”, Editura Polirom, 2002
  • „Mică Enciclopedie de Statistică”, Marus Iosifescu, Costache Moineagu, Vladimir Trebici, Emiliana Ursianu, Editura Științifică și Enciclopedică, 1984
  • L.B. Iantovics, C. Rotar, F. Morar, "Survey on establishing the optimal number of factors in exploratory factor analysis applied to data mining", Wiley Interdisciplinary Reviews: Data Mining and Knowledge Discovery 9(2), 2019, e1294.

Legături externe

[modificare | modificare sursă]