Lingvistică computaţională

De la Wikipedia, enciclopedia liberă

Salt la: Navigare, căutare
Acest articol participă la Concursul de scriere. Ajutaţi la îmbunătăţirea lui!

Lingvistica computaţională este un domeniu interdisciplinar care se ocupă de modelarea statistică sau bazată pe reguli a limbajelor naturale, dintr-un punct de vedere legat de calculatoare. Modelarea aceasta poate avea ca obiect orice domeniu lingvistic. Prin tradiţie, cei care se ocupă cu lingvistica computaţională sunt cercetătorii ştiinţifici în domeniul informaticii, specializaţi în aplicarea computerelor la prelucrarea automată a limbajelor naturale. Aceşti specialişti trebuie de obicei să coopereze şi cu lingvişti, experţi în limbi precum şi cu informaticieni/programatori de aplicaţie. Sunt necesare şi contacte cu experţi în Inteligenţa Artificială (AI), matematicieni, psihologi cognitivi, psiho-lingvişti, antropologi, neurologi şi mulţi alţii.

Cuprins

[modifică] Începuturile

Lingvistica computaţională aparţine de largul domeniu al inteligenţei artificiale. A luat naştere prin anii 1950 în SUA cu ocazia primelor încercări de a traduce automat (cu ajutorul calculatoarelor) texte din limbi străine, în special din l. rusă în l. engleză. Cele mai căutate texte erau cele din diverse reviste de ştiinţă.[1]

Plecând de la rapiditatea calculatoarelor în domeniul aritmeticii s-a crezut la început că şi traducerile automate vor putea fi realizate în scurt timp, obţinându-se şi viteze de lucru superioare faţă de traducerile obişnuite (manuale). Totuşi cercetătorii s-au lovit curând de complexitatea structurilor limbilor naturale, iar traducerile lor automate ("mecanice", computerizate) au lăsat mult de dorit din punctul de vedere al calităţii şi acurateţei traducerilor. Termenul "lingvistică computaţională" a apărut prin anii 1960, când a luat naştere domeniul inteligenţei artificiale. De data asta era vorba de încercări de a extrage automat "semnificaţia" unui text, bazată pe diverse formalisme, cu scopul creerii unor algoritme şi programe de prelucrare inteligentă (analiză, înţelegere, interpretare, traducere) a textelor. De remarcat că fiinţele umane fac cu uşurinţă astfel de operaţii mentale (chiar dacă nu foarte repede).

S-a recunoscut repede că, pentru a traduce automat un text dintr-o limbă în alta, este nevoie şi de cunoştinţe gramaticale profunde (atât de morfologie, cât şi de sintaxă). Apoi mai sunt absolut necesare şi lexicoane (vocabulare) complete ale ambelor limbi, dar şi cunoştinţe foarte pragmatice despre felul cum "funcţionează" fiecare din cele două limbi şi trăsăturile lor mai subtile, foarte specifice. În acest fel, pe parcursul timpului, din simpla dorinţă de a traduce texte în mod automat a luat naştere o întreagă ramură nouă de cercetări în domeniul reprezentării, "înţelegerii" şi procesării limbajelor naturale cu ajutorul calculatoarelor.

[modifică] Subdomenii

Din punct de vedere al mediului purtător se depun eforturi atât în domeniul textelor scrise cât şi al textelor rostite. Prelucrarea automată poate avea drept ţel atât analiza textului şi recunoaşterea semnificaţiei, de exemplu recunoşterea automată a spuselor unui vorbitor, cât şi sintetizarea (generarea) de text tradus în altă limbă sau generarea de text rostit (acustic).

Alte subdomenii de activitate:

  • Complexitatea limbilor naturale, modelată pe baza teoriei automatelor şi aplicând gramatica contextuală şi maşinile Turing lineare
  • Semantica informaţională, filtrarea şi prelucrarea "seminificaţiei" unui text
  • Lingvistica corporală (corpus linguistics)
  • Proiectarea de parsere pentru limbile naturale

[modifică] Vezi şi

[modifică] Referinţe

  1. ^ John Hutchins: Retrospect and prospect in computer-based translation. Proceedings of MT Summit VII, 1999, pp. 30–44.

[modifică] Legături externe

Format:WVD

Unelte personale