Sari la conținut

Vizualizarea datelor

De la Wikipedia, enciclopedia liberă

Vizualizarea datelor este reprezentarea grafică a datelor. Presupune producerea de imagini care comunică relații între datele reprezentate cu spectatorii imaginilor. Această comunicare se realizează prin utilizarea unei aplicații sistematice între mărcile grafice și valorile datelor în crearea vizualizării. Această mapare stabilește modul în care valorile datelor vor fi reprezentate vizual, determinând cum și în ce măsură o proprietate a unei mărci grafice, cum ar fi dimensiunea sau culoarea, se va schimba pentru a reflecta modificarea valorii unei date.

Pentru a comunica informația în mod clar și eficient, vizualizarea datelor folosește grafică statistică⁠(d), reprezentare grafică, grafică digitală și alte instrumente. Datele numerice pot fi codate folosind puncte, linii sau bare, pentru a comunica vizual un mesaj cantitativ.[1] Vizualizarea eficientă îi ajută pe utilizatori să analizeze și să motiveze date și dovezi. Face ca datele complexe sa fie mai accesibile, inteligibile și utilizabile. Utilizatorii pot avea sarcini analitice particulare, cum ar fi efectuarea de comparații sau înțelegerea cauzalității, iar principiul de design al graficului (adică, a face comparații sau a arăta cauzalitatea) urmărește sarcina. Tabelele sunt utilizate în general în care utilizatorii vor căuta o măsurătoare specifică, în timp ce graficele de diferite tipuri utilizate pentru a afișa modele sau relații între date pentru una sau mai multe variabile.

Vizualizarea datelor este atât o artă, cât și o știință.[2] Este privita ca o ramură a statisticilor descriptive de către unii, dar și ca un instrument bazat pe dezvoltarea teoriei solide[care?] către alții. Cantitățile crescute de date create de activitatea de pe Internet și un număr în continuă expansiune de senzori din mediul înconjurător sunt denumite „date mari” sau internet al lucrurilor. Prelucrarea, analizarea și comunicarea acestor date prezintă provocări etice și analitice pentru vizualizarea datelor.[3] Domeniul științei datelor și practicienilor numiți oamenii de știință ai datelor ajută la abordarea acestei provocări.[4]

Prezentare generală

[modificare | modificare sursă]
Vizualizarea datelor este unul dintre pașii în analiza datelor și prezentarea acestora către utilizatori.

Vizualizarea datelor se referă la tehnicile utilizate pentru a comunica date sau informații prin codificarea lor ca obiecte vizuale (de exemplu, puncte, linii sau bare) conținute în grafică. Scopul este de a comunica informații în mod clar și eficient utilizatorilor. Este unul dintre pașii în analiza datelor sau știința datelor. Conform Friedman (2008) „principalul obiectiv al vizualizării datelor este de a comunica informația în mod clar și eficient prin mijloace grafice. Nu înseamnă că vizualizarea datelor trebuie să pară plictisitoare pentru a fi funcțională sau extrem de sofisticată pentru a arăta frumos. Pentru a transmite ideile în mod eficient, atât forma estetică, cât și funcționalitatea trebuie să meargă mână în mână, oferind informații despre un set de date destul de rar și complex, prin comunicarea aspectelor-cheie într-un mod mai intuitiv. Cu toate acestea, deseori proiectanții nu reușesc să realizeze un echilibru între formă și funcție, creând vizualizări superbe de date care nu își îndeplinesc scopul principal - comunicarea informațiilor"[5]

Într-adevăr, Fernanda Viegas⁠(d) și Martin M. Wattenberg⁠(d) au sugerat că o vizualizare ideală nu trebuie doar să comunice clar, ci și să stimuleze implicarea și atenția privitorului. [6]

Vizualizarea datelor este strâns legată de grafica digitală, vizualizarea informațiilor, vizualizarea științifică, analiza datelor exploratorii și grafică statistică. În noul mileniu, vizualizarea datelor a devenit o zonă activă de cercetare, predare și dezvoltare. Conform Post et al. (2002), a unit vizualizarea științifică și informațională.[7]

În mediul comercial vizualizarea datelor este adesea denumită tablouri de bord. Grafica digitală este o altă formă foarte comună de vizualizare a datelor.

Caracteristicile afișajelor grafice eficiente

[modificare | modificare sursă]
Diagrama din 1869 a lui Charles Joseph Minard⁠(d) a invaziei Franței napoleoniene în Rusia, un exemplu timpuriu al unei informații grafice

Adevărata valoarea a unei imagini este aceea de a ne arata neașteptatul.

Profesorul Edward Tuft⁠(d) a explicat că utilizatorii afișajelor de informații execută anumite sarcini analitice, cum ar fi comparațiile. Principiul de design al graficului informațional ar trebui să sprijine sarcina analitică.[8] După cum arată William Cleveland și Robert McGill, diferite elemente grafice realizează acest lucru mai mult sau mai puțin eficient. De exemplu, graficele cu puncte și diagramele de bare depășesc graficele de plăci. [9]

În cartea sa din 1983 The Visual Display of Quantitative Information, Edward Tufte definește „afișări grafice” și principii pentru afișarea grafică eficientă în următorul pasaj: „Excelența în grafică statistică constă în idei complexe comunicate cu claritate, precizie și eficiență. Afișele grafice ar trebui să:

  • arate datele
  • induce privitorul să se gândească la substanță și nu la metodologie, design grafic, tehnologia producției grafice sau altceva
  • evitați denaturarea a ceea ce trebuie să spună datele
  • prezentați numeroase numere într-un spațiu mic
  • face coerența seturilor mari de date
  • încurajați ochiul să compare diferite date
  • dezvăluiți datele la mai multe niveluri de detaliu, dintr-o imagine de ansamblu largă până la structura fină
  • servesc unui scop destul de clar: descrierea, explorarea, întocmirea sau decorarea
  • să fie strâns integrat cu descrierile statistice și verbale ale unui set de date.

Graficele dezvăluie datele. Într-adevăr, grafica poate fi mai precisă și mai revelatoare decât calculele statistice convenționale."[10]

De exemplu, diagrama Minard arată pierderile suferite de armata lui Napoleon în perioada 1812-1813. Sunt reprezentate șase variabile: dimensiunea armatei, amplasarea acesteia pe o suprafață bidimensională (x și y), timp, direcția de mișcare și temperatură. Lățimea liniei ilustrează o comparație (dimensiunea armatei la puncte în timp), în timp ce axa de temperatură sugerează o cauză a modificării dimensiunii armatei. Acest afișaj multivariat pe o suprafață bidimensională spune o poveste care poate fi înțeleasă imediat, în timp ce se identifică datele sursă pentru a-și construi credibilitatea. Tufte a scris în 1983 că: „Poate fi cel mai bun grafic statistic întocmit vreodată”.[10]

Neaplicarea acestor principii poate duce la grafice derutante, care denaturează mesajul sau susțin o concluzie eronată. Potrivit lui Tufte, grafica inutilă⁠(d) se referă la decorarea interioară a graficului, care nu îmbunătățește mesajul sau efecte tridimensionale sau de perspectivă gratuite. Separarea inutilă a cheii explicative de imaginea în sine, necesitând ochiului să călătorească înainte și înapoi de la imagine la cheie, este o formă de „resturi administrative”. Raportul „date la cerneală” ar trebui maximizat, ștergând cerneala fără date acolo unde este posibil. [10]

Oficiul pentru bugetul Congresului a rezumat câteva bune practici pentru afișări grafice într-o prezentare din iunie 2014. Acestea cuprind:[11]

  • cunoașterea publicului tău;
  • proiectarea graficelor astfel încât să poată sta singure, în afara contextului raportului;
  • proiectarea graficelor care comunică mesajele cheie din raport.

Mesaje cantitative

[modificare | modificare sursă]
O serie de timp ilustrată cu un grafic liniar care arată tendințele cheltuielilor și veniturilor federale ale SUA în timp.
Un scatterplot care ilustrează corelația negativă între două variabile (inflație și șomaj) măsurată la un moment dat.

Autorul Stephen Few a descris opt tipuri de mesaje cantitative pe care utilizatorii pot încerca să le înțeleagă sau să le comunice dintr-un set de date și din graficele asociate utilizate pentru a ajuta la comunicarea mesajului:

  1. Serii de timp: o singură variabilă este capturată pe o perioadă de timp, cum ar fi rata șomajului pe o perioadă de 10 ani. Poate fi utilizat un grafic liniar pentru a demonstra tendința.
  2. Clasament: Subdiviziunile categorice sunt clasificate în ordine crescătoare sau descendentă, cum ar fi un clasament al performanței vânzărilor (măsura) de către persoanele de vânzări (categoria, cu fiecare persoană de vânzări o subdiviziune categorică) într-o singură perioadă. Poate fi utilizat un grafic cu bare⁠(d) pentru a arăta comparația între persoanele de la vânzare.
  3. Fracțiuni: Subdiviziunile categorice sunt măsurate ca raport cu întregul (adică un procent din 100 %). O diagramă circulară⁠(d) sau un grafic cu bare poate arăta compararea raporturilor, cum ar fi cota de piață reprezentată de concurenții pe o piață.
  4. Abatere: Subdiviziunile categorice sunt comparate cu o referință, cum ar fi o comparație între cheltuielile reale și cele bugetare pentru mai multe departamente ale unei afaceri pentru o anumită perioadă de timp. Un grafic de bare poate arăta o comparație între valoarea reală și suma de referință.
  5. Distribuția frecvenței: arată numărul de observații ale unei anumite variabile pentru un interval dat, cum ar fi numărul de ani în care randamentul bursei este între intervale precum 0-10%, 11-20% etc. Pentru această analiză poate fi utilizată o histogramă⁠(d), un tip de diagramă de bare. Un boxplot ajută la vizualizarea statisticilor cheie despre distribuție, cum ar fi mediana, cuartila, valorile etc.
  6. Corelație: comparație între observațiile reprezentate de două variabile (X, Y) pentru a determina dacă acestea tind să se miște în aceeași direcție sau opuse. De exemplu, complotarea șomajului (X) și inflația (Y) pentru un eșantion de luni. Un grafic de dispersie⁠(d) este de obicei utilizat pentru acest mesaj.
  7. Comparație nominală: Compararea subdiviziunilor categorice într-o anumită ordine, cum ar fi volumul vânzărilor după codul produsului. Pentru această comparație se poate utiliza un grafic de bare.
  8. Geografică sau geospațială: Comparație a unei variabile pe o hartă sau un aspect, cum ar fi rata șomajului în funcție de stat sau numărul de persoane de pe diversele etaje ale unei clădiri. O cartogramă este o grafică tipică utilizată. [1] [12]

Analiștii care examinează un set de date pot lua în considerare dacă unele sau toate mesajele și tipurile grafice de mai sus sunt aplicabile sarcinii și publicului lor. Procesul de încercare și eroare pentru identificarea relațiilor și mesajelor semnificative din date face parte din analiza datelor exploratorii.

Percepția vizuală și vizualizarea datelor

[modificare | modificare sursă]

Un om poate distinge ușor diferențele de lungime, formă, orientare și culoare (nuanță), fără efort semnificativ de procesare; acestea sunt denumite „atribute pre-atente”. De exemplu, poate necesita timp și efort semnificativ („procesare atentă”) pentru a identifica numărul de ori în care apare cifra „5” într-o serie de numere; dar dacă cifra respectivă este diferită ca dimensiune, orientare sau culoare, instanțele pot fi notate rapid prin procesarea pre-atentă.[13]

Grafica eficientă profită de prelucrarea prealabilă și atributele și puterea relativă a acestor atribute. De exemplu, având în vedere că oamenii pot prelucra mai ușor diferențele de lungime a liniei decât suprafața, poate fi mai eficient să folosești un grafic de bare (care profită de lungimea liniei pentru a arăta comparația) decât de grafice (care folosesc suprafața pentru a arăta comparația).[13]

Percepția/cogniția umană și vizualizarea datelor

[modificare | modificare sursă]

Aproape toate vizualizările de date sunt create pentru consum uman. Cunoașterea percepției și a cunoașterii umane este necesară atunci când proiectăm vizualizări intuitive.[14] Cogniția se referă la procese din ființe umane precum percepția, atenția, învățarea, memoria, gândirea, formarea conceptelor, citirea și rezolvarea problemelor.[15] Prelucrarea vizuală umană este eficientă în detectarea schimbărilor și în comparații între cantități, dimensiuni, forme și variații de ușurință. Atunci când proprietățile datelor simbolice sunt redate cu proprietăți vizuale, oamenii pot naviga eficient în cantități mari de date. Se estimează că 2/3 dintre neuronii creierului pot fi implicați în procesarea vizuală. Vizualizarea corectă oferă o abordare diferită pentru a afișa conexiuni potențiale, relații etc., care nu sunt la fel de evidente în datele cantitative ne vizualizate. Vizualizarea poate deveni un mijloc de explorare a datelor.

Studiile au arătat că persoanele folosesc în medie cu 19% mai puține resurse cognitive și 4,5% sunt mai capabile să-și amintească detaliile atunci când compară vizualizarea datelor cu textul.[16]

Istoricul vizualizării datelor

[modificare | modificare sursă]

Nu există o „istorie” cuprinzătoare a vizualizării datelor. Nu există conturi care să cuprindă întreaga dezvoltare a gândirii vizuale și reprezentarea vizuală a datelor și care adună contribuțiile disciplinelor disparate.[17] Michael Friendly și Daniel J Denis de la Universitatea York sunt angajați într-un proiect care încearcă să ofere o istorie cuprinzătoare a vizualizării. Contrar credinței generale, vizualizarea datelor nu este o dezvoltare modernă. Datele stelare sau informații precum locația stelelor au fost vizualizate pe pereții peșterilor (cum ar fi cele găsite în Peștera Lascaux din sudul Franței) încă din epoca Pleistocenului.[18] Artefacte fizice, cum ar fi jetoanele de lut Mesopotamian (5500 î.e.n.), Inca quipus (2600 î.e.n.) și Insulele Marshall grafice cu bețe (nd) pot fi de asemenea considerate ca vizualizarea informațiilor cantitative.[19][20]

Primul document cu vizualizare a datelor poate fi urmărită până în 1160 î.Hr., cu harta Papyrus din Torino, care ilustrează cu exactitate distribuția resurselor geologice și oferă informații despre cariera acestor resurse.[21] Astfel de hărți pot fi clasificate drept Cartografie tematică, care este un tip de vizualizare a datelor care prezintă și comunică date și informații specifice printr-o ilustrație geografică concepută pentru a arăta o anumită temă conectată cu o zonă geografică specifică. Cele mai documentate forme de vizualizare a datelor au fost diferite hărți tematice din diferite culturi și ideograme și hieroglife care au oferit și au permis interpretarea informațiilor ilustrate. De exemplu, tabletele Linear B de Mycenae au oferit o vizualizare a informațiilor cu privire la tranzacțiile din epoca bronzului târziu din Mediterana. Ideea de coordonate a fost folosită de antologii egipteni antici în stabilirea orașelor, pozițiile pământești și cerești au fost localizate cu ceva asemănător cu latitudinea și longitudinea cel puțin până în 200 î.Hr., iar proiecția hărții a unui pământ sferic în latitudine și longitudine de Claudius Ptolemeu [ c.85-c. 165] în Alexandria va servi drept standarde de referință până în secolul al XIV-lea.

Invenția hârtiei și a pergamentului a permis dezvoltarea în continuare a vizualizărilor de-a lungul istoriei. Figura prezintă un grafic din secolul al X-lea sau, eventual, al XI-lea, care este destinat să fie o ilustrare a mișcării planetare, utilizat într-un apendice al unui manual în școlile mănăstirii.[22] Se pare că graficul a reprezentat un grafic al înclinațiilor orbitelor planetare în funcție de timp. În acest scop, zona zodiacului a fost reprezentată pe un plan cu o linie orizontală împărțită în treizeci de părți ca timp sau ax longitudinal. Axa verticală desemnează lățimea zodiacului. Scara orizontală pare să fi fost aleasă individual pentru fiecare planetă, deoarece perioadele nu pot fi reconciliate. Textul însoțitor se referă doar la amplitudini. Curbele aparent nu sunt legate în timp.

Mișcări planetare

Până în secolul al XVI-lea, tehnicile și instrumentele pentru observarea și măsurarea precisă a mărimilor fizice și poziția geografică și cerească erau bine dezvoltate (de exemplu, un „cadran de perete” construit de Tycho Brahe [1546-1601], acoperind un întreg perete în observatorul său). Deosebit de importante au fost dezvoltarea triangulației și a altor metode pentru a determina cu exactitate locațiile de cartografiere. [17]

Filosoful și matematicianul francez René Descartes și Pierre de Fermat au dezvoltat geometria analitică și sistemul de coordonate bidimensionale care au influențat puternic metodele practice de afișare și calcul al valorilor. Lucrarea lui Fermat și Blaise Pascal despre statistică și teoria probabilității a pus bazele a ceea ce acum conceptualizăm ca date.[17] Conform Interaction Design Foundation, aceste evoluții au permis și l-au ajutat pe William Playfair, care a văzut potențialul de comunicare grafică a datelor cantitative, să genereze și să dezvolte metode grafice de statistici.[14]

Serie de timp a lui Playfair

În cea de a doua jumătate a secolului al XX-lea, Jacques Bertin⁠(d) a folosit grafice cantitative pentru a reprezenta informațiile „intuitiv, clar, precis și eficient”.[14]

John Tukey și Edward Tufte au depășit limitele vizualizării datelor; Tukey cu noua sa abordare de statistică a analizei de datele exploratorii și Tufte cu cartea sa „The Visual Display of Quantitative Information” au deschis calea pentru rafinarea tehnicilor de vizualizarea datelor pentru mai mult decât statisticieni. Odată cu progresul tehnologiei a progresat și vizualizarea datelor; începând cu vizualizări desenate manual și evoluând către aplicații mai tehnice - inclusiv designuri interactive care duc la vizualizarea software-ului.[23]

Programe precum SAS, SOFA, R, Minitab⁠(d), Cornerstone și multe altele permit vizualizarea datelor în domeniul statisticilor. Alte aplicații de vizualizare a datelor, mai concentrate și unice pentru indivizi, limbaje de programare precum D3⁠(d), Python și JavaScript ajută la transformarea vizualizării datelor cantitative într-o posibilitate. Școlile private au dezvoltat, de asemenea, programe pentru a satisface cererea de vizualizare a datelor de învățare și biblioteci de programare asociate, inclusiv programe gratuite precum "The Data Incubator" sau programe plătite precum "General Assembly".[24]

Începând cu Simpozionul „Date to Discovery” din 2013, Colegiul de Design ArtCenter, Caltech și JPL din Pasadena au derulat un program anual de vizualizare interactivă a datelor.[25] Programul întreabă: Cum poate vizualizarea interactivă a datelor să ajute oamenii de știință și inginerii să-și exploreze datele mai eficient? Cum poate calculul, proiectarea și gândirea în proiectare să contribuie la maximizarea rezultatelor cercetării? Ce metodologii sunt cele mai eficiente pentru valorificarea cunoștințelor din aceste domenii? Prin codificarea informațiilor relaționale cu caracteristici vizuale și interactive adecvate pentru a ajuta la interogare și, în cele din urmă, pentru a obține o nouă perspectivă asupra datelor, programul dezvoltă noi abordări interdisciplinare ale problemelor științifice complexe, valorificând gândirea de proiectare și cele mai noi metode de calcul, proiectarea centrată pe utilizator, proiectarea interacțiunii și grafică 3D.

Vizualizarea datelor implică terminologie specifică, dintre care unele sunt derivate din statistici. De exemplu, autorul Stephen Few definește două tipuri de date, care sunt utilizate în combinație pentru a susține o analiză sau vizualizare semnificativă:

  • Categoric: etichete text care descriu natura datelor, cum ar fi „Nume” sau „Vârstă”. Acest termen acoperă, de asemenea, date calitative (nenumerice).
  • Cantitativ: măsuri numerice, cum ar fi „25” pentru a reprezenta vârsta în ani.

Două tipuri principale de afișare a informațiilor sunt: tabele și grafice.

  • Un tabel conține date cantitative organizate în rânduri și coloane cu etichete categorice. Este utilizat în principal pentru a căuta valori specifice. În exemplul de mai sus, tabelul ar putea avea etichete de coloană categorice reprezentând numele (o variabilă calitativă) și vârsta (o variabilă cantitativă), fiecare rând de date reprezentând o persoană (eșantionul experimental eșuat sau subdiviziunea categoriei).
  • Un grafic este utilizat în principal pentru a arăta relațiile dintre date și pentru a descrie valori codificate ca obiecte vizuale (de exemplu, linii, bare sau puncte). Valorile numerice sunt afișate într-o zonă delimitată de una sau mai multe axe. Aceste axe oferă scări (cantitative și categorice) utilizate pentru etichetarea și atribuirea valorilor obiectelor vizuale. Multe grafice sunt denumite și diagrame.[26]

Eppler și Lengler au dezvoltat „Tabelul periodic al metodelor de vizualizare”, o diagramă interactivă care afișează diferite metode de vizualizare a datelor. Include șase tipuri de metode de vizualizare a datelor: date, informații, concept, strategie, metaforă și compus.[27]

Exemple de diagrame utilizate pentru vizualizarea datelor

[modificare | modificare sursă]
Nume Dimensiuni vizuale Exemple de utilizări
Diagrama cu bare cu sfaturi în funcție de ziua săptămânii
Diagramă cu bare
  • lungime/numărare
  • categorie
  • (culoare)
  • Compararea valorilor, cum ar fi performanța vânzărilor pentru mai multe persoane sau companii într-o singură perioadă de timp. Pentru o singură variabilă măsurată în timp (tendință) este preferabilă o diagramă liniară.
Histograma prețurilor locuințelor
Histogramă
  • limite bin
  • număr / lungime
  • (culoare)
  • Determinarea frecvenței rentabilității procentuale anuale pe piața bursieră în anumite intervale (pubele), cum ar fi 0-10%, 11-20% etc. Înălțimea barei reprezintă numărul de observații (ani) cu revenire % în intervalul reprezentat de coșul de gunoi.
Grafic de dispersie de bază a două variabile (2D)
Grafic de dispersie
  • poziția x
  • poziția y
  • (simbol/glif)
  • (culoare)
  • (mărimea)
  • Determinarea relației (de exemplu, corelație) dintre șomaj (x) și inflație (y) pentru perioade multiple de timp.
Grafic de dispersie (3D)
Grafic de dispersie (3D)
  • poziția x
  • poziția y
  • poziția z
  • culoare
Analiza rețelei
Rețea
  • dimensiunea nodurilor
  • culoarea nodurilor
  • grosimea legăturilor
  • culoarea cravatelor
  • spațializare
  • Găsirea clusterelor în rețea (de exemplu, gruparea prietenilor Facebook în diferite clustere).
  • Descoperirea podurilor (brokeri de informații sau chei de limită) între clustere din rețea
  • Determinarea celor mai influente noduri din rețea (de ex O companie dorește să vizeze un grup mic de oameni pe Twitter pentru o campanie de marketing).
  • Găsirea unor actori anormali care nu se încadrează în niciun cluster sau se află în periferia unei rețele.
Streamgraph
Streamgraph⁠(d)
  • lățime
  • culoare
  • timp (flux)
Harta de arbori
Harta de arbori
  • mărimea
  • culoare
  • spațiu pe disc după locație/tip de fișier
Diagrama Gantt
Diagrama Gantt
  • culoare
  • timp (flux)
Harta termografica
Harta termografica
  • rând
  • coloană
  • grup
  • culoare
  • Analiza riscului, cu verde, galben și roșu, reprezentând un risc scăzut, mediu și, respectiv, ridicat.
Grafic cu dungi
Grafic cu dungi
  • poziția x
  • culoare
  • Portretizează o singură variabilă - temperatura prototip în timp pentru a descrie încălzirea globală
  • Deliberat minimalist - fără indicii tehnice - pentru a comunica intuitiv cu non-oamenii de știință
  • Poate fi „stivuit” pentru a reprezenta serii de plural (exemplu)
Grafică spirală animată
Grafică spirală animată
  • distanta radiala (variabila dependenta)
  • unghiul de rotație (ciclul de luni)
  • culoare (ani trecători)
  • Portretizează o singură variabilă dependentă - temperatura prototip în timp pentru a descrie încălzirea globală
  • Variabila dependentă este reprezentată progresiv de-a lungul unei „spirale” continue determinate în funcție de (a) unghiul de rotație constantă (douăsprezece luni pe rotație) și (b) culoarea în evoluție (schimbarea culorii pe parcursul anilor care trec) [28]

Alte perspective

[modificare | modificare sursă]

Există diferite abordări cu privire la scopul vizualizării datelor. Un accent comun se pune pe prezentarea informațiilor, cum ar fi Friedman (2008). Friendly (2008) presupune două părți principale ale vizualizării datelor: grafică statistică și cartografie tematică. În această linie, articolul „Vizualizare date: abordări moderne” (2007) oferă o prezentare generală a șapte subiecte de vizualizare a datelor:[29]

Toate aceste subiecte sunt strâns legate de designul grafic și reprezentarea informațiilor.

Pe de altă parte, din perspectiva informaticii, Frits H. Post, în 2002, a clasificat domeniul în subcâmpuri:[7][30]

Arhitectura de prezentare a datelor

[modificare | modificare sursă]
O vizualizare a datelor de pe social media

Arhitectura de prezentare a datelor (APD) este un set de abilități care urmărește să identifice, să localizeze, să manipuleze, să formateze și să prezinte date în așa fel încât să comunice în mod optim semnificația și cunoștințele adecvate.

Din punct de vedere istoric, termenul de arhitectură de prezentare a datelor este atribuit lui Kelly Lautt:[a] „Arhitectura de prezentare a datelor (APD) este o serie de abilități rare aplicate, critice pentru succesul și valoarea in Inteligenta Afacerilor. Arhitectura de prezentare a datelor îmbină știința numerelor, a datelor și a statisticilor în descoperirea informațiilor valoroase din date și transformarea acestora în utilizabilă, relevantă și acționabilă cu arta vizualizării datelor, a comunicațiilor, a psihologiei organizaționale și a gestionării schimbărilor pentru a oferi soluții de inteligenta afacerilor in sfera de aplicare, calendarul de livrare, formatul și vizualizările care vor susține cel mai eficient și vor conduce comportamentul operațional, tactic și strategic către obiective de afaceri (sau organizaționale) înțelese. ADP nu este nici un set de competențe IT, nici de afaceri, dar există ca un domeniu de expertiză separat. Adesea confundată cu vizualizarea datelor, arhitectura de prezentare a datelor este un set de abilități mult mai larg care include determinarea ce date cu privire la ce program și în ce format exact urmează să fie prezentate, nu doar cel mai bun mod de a prezenta date care au fost deja alese. Abilitățile de vizualizare a datelor sunt un element al ADP."

ADP are două obiective principale:

  • Pentru a utiliza datele pentru a furniza cunoștințe în cel mai eficient mod posibil (minimizați zgomotul, complexitatea și datele sau detaliile inutile, având în vedere nevoile și rolurile fiecărui public)
  • Utilizarea datelor pentru a furniza cunoștințe în cel mai eficient mod posibil (furnizați date relevante, în timp util și complete fiecărui membru al audienței într-o manieră clară și ușor de înțeles, care transmite o semnificație importantă, este acționabilă și poate afecta înțelegerea, comportamentul și deciziile)

Domeniul de aplicare

[modificare | modificare sursă]

Având în vedere obiectivele de mai sus, activitatea reală a arhitecturii de prezentare a datelor constă în:

  • Crearea unor mecanisme de livrare eficiente pentru fiecare membru al audienței, în funcție de rolul, sarcinile, locațiile și accesul la tehnologie
  • Definirea sensului important (cunoștințe relevante) de care este nevoie fiecare membru al audienței în fiecare context
  • Determinarea periodicității necesare a actualizărilor de date (moneda datelor)
  • Stabilirea momentului potrivit pentru prezentarea datelor (când și cât de des trebuie să vadă utilizatorul datele)
  • Găsirea datelor corecte (subiect, acoperire istorică, lățime, nivel de detaliere etc.)
  • Folosind analize, grupări, vizualizare și alte formate de prezentare adecvate

Domenii similare

[modificare | modificare sursă]

Activitatea arhitecturii de prezentare a datelor împărtășește elemente comune cu alte câteva domenii, inclusiv:

  • Analiza afacerii în determinarea obiectivelor de afaceri, colectarea cerințelor, procesele de cartografiere.
  • Îmbunătățirea procesului de afaceri prin faptul că scopul său este de a îmbunătăți și raționaliza acțiunile și deciziile în vederea realizării obiectivelor de afaceri
  • Vizualizarea datelor prin faptul că folosește teorii bine stabilite ale vizualizării pentru a adăuga sau evidenția semnificația sau importanța în prezentarea datelor.
  • Arhitectura informațională, dar arhitectura informației se concentrează pe date nestructurate și, prin urmare, exclude atât analiza (în sensul statistic/date), cât și transformarea directă a conținutului real (date, pentru APD) în entități și combinații noi.
  • HCI (interacțiunea om-calculator) și proiectarea interacțiunii, deoarece multe dintre principiile modului în care se proiectează vizualizarea interactivă a datelor au fost dezvoltate interdisciplinar cu HCI.
  • Jurnalism vizual și jurnalism bazat pe date sau jurnalism de date: Jurnalismul vizual este preocupat de toate tipurile de facilitare grafică a povestirii știrilor, iar jurnalismul bazat pe date și jurnalismul de date nu este neapărat spus cu vizualizarea datelor. Cu toate acestea, domeniul jurnalismului este în avangarda dezvoltării de noi vizualizări de date pentru comunicarea datelor.
  • Design grafic, transmiterea informațiilor prin stil, tipografie, poziție și alte preocupări estetice.
  1. ^ a b „Stephen Few-Perceptual Edge-Selecting the Right Graph for Your Message-2004” (PDF). 
  2. ^ Manuela Aparicio and Carlos J. Costa (noiembrie 2014). „Data visualization”. Communication Design Quarterly Review. 3 (1): 7–11. doi:10.1145/2721882.2721883. 
  3. ^ Nikos Bikaks (2018) "Big Data Visualization Tools" Encyclopedia of Big Data Technologies, Springer 2018.
  4. ^ Press, Gil. „A Very Short History Of Data Science”. 
  5. ^ Vitaly Friedman (2008) "Data Visualization and Infographics" in: Graphics, Monday Inspiration, January 14th, 2008.
  6. ^ Fernanda Viegas and Martin Wattenberg (). „How To Make Data Look Sexy”. CNN.com. Arhivat din original la . Accesat în . 
  7. ^ a b Frits H. Post, Gregory M. Nielson and Georges-Pierre Bonneau (2002). Data Visualization: The State of the Art. Research paper TU delft, 2002. Arhivat în , la Wayback Machine..
  8. ^ techatstate (). „Tech@State: Data Visualization - Keynote by Dr Edward Tufte”. 
  9. ^ [1]
  10. ^ a b c Tufte, Edward (). The Visual Display of Quantitative Information. Cheshire, Connecticut: Graphics Press. ISBN 0-9613921-4-2. 
  11. ^ „Telling Visual Stories About Data - Congressional Budget Office”. www.cbo.gov. 
  12. ^ „Stephen Few-Perceptual Edge-Graph Selection Matrix” (PDF). 
  13. ^ a b „Steven Few-Tapping the Power of Visual Perception-September 2004” (PDF). 
  14. ^ a b c „Data Visualization for Human Perception”. The Interaction Design Foundation. Accesat în . 
  15. ^ „Visualization” (PDF). SFU. SFU lecture. Arhivat din original (PDF) la . Accesat în . 
  16. ^ Graham, Fiona (). „Can images stop data overload?”. BBC News (în engleză). Accesat în . 
  17. ^ a b c Friendly, Michael. „A Brief History of Data Visualization”. Springer-Verlag. Accesat în . 
  18. ^ Whitehouse, D. (). „Ice Age star map discovered”. BBC News. Accesat în . 
  19. ^ Dragicevic, Pierre; Jansen, Yvonne (). „List of Physical Visualizations and Related Artefacts”. Accesat în . 
  20. ^ Jansen, Yvonne; Dragicevic, Pierre; Isenberg, Petra; Alexander, Jason; Karnik, Abhijit; Kildal, Johan; Subramanian, Sriram; Hornbaek, Kasper (). „Opportunities and challenges for data physicalization”. Proceedings of the 33rd Annual ACM Conference on Human Factors in Computing Systems: 3227–3236. 
  21. ^ Friendly, Michael (). „Milestones in the history of thematic cartography, statistical graphics, and data visualization”. Arhivat din original la . Accesat în . 
  22. ^ Funkhouser, Howard Gray (). „A Note on a Tenth Century Graph”. Osiris. 1: 260–262. doi:10.1086/368425. JSTOR 301609. 
  23. ^ Friendly, Michael (). „A Brief History of Data Visualization” (PDF). York University. Springer-Verlag. Arhivat din original (PDF) la . Accesat în . 
  24. ^ „NY gets new boot camp for data scientists: It's free but harder to get into than Harvard”. Venture Beat. Arhivat din original la . Accesat în . 
  25. ^ Interactive Data Visualization
  26. ^ „Steven Few-Selecting the Right Graph for Your Message-September 2004” (PDF). Arhivat din original (PDF) la . Accesat în . 
  27. ^ Lengler, Ralph; Eppler, Martin. J. „Periodic Table of Visualization Methods”. www.visual-literacy.org. Arhivat din original la . Accesat în . 
  28. ^ Mooney, Chris (). „This scientist just changed how we think about climate change with one GIF”. The Washington Post. Arhivat din original la . Ed Hawkins⁠(d) took these monthly temperature data and plotted them in the form of a spiral, so that for each year, there are twelve points, one for each month, around the center of a circle – with warmer temperatures farther outward and colder temperatures nearer inward. 
  29. ^ "Data Visualization: Modern Approaches" Arhivat în , la Wayback Machine.. in: Graphics, August 2nd, 2007
  30. ^ Frits H. Post, Gregory M. Nielson and Georges-Pierre Bonneau (2002). Data Visualization: The State of the Art Arhivat în , la Wayback Machine..
  1. ^ The first formal, recorded, public usages of the term data presentation architecture were at the three formal Microsoft Office 2007 Launch events in Dec, Jan and Feb of 2007–08 in Edmonton, Calgary and Vancouver (Canada) in a presentation by Kelly Lautt describing a business intelligence system designed to improve service quality in a pulp and paper company. The term was further used and recorded in public usage on December 16, 2009 in a Microsoft Canada presentation on the value of merging Business Intelligence with corporate collaboration processes.

Lecturi suplimentare

[modificare | modificare sursă]

linkuri externe

[modificare | modificare sursă]