TTR
TTR (Type-Token Ratio), adica raportul dintre numarul de cuvinte unice si numarul total de cuvinte dintr-un text este una dintre cele mai simple metode de a masura diversitatea vocabularului
Ce este TTR?
TTR inseamna Type-Token Ratio, adica raportul dintre numarul de cuvinte unice si numarul total de cuvinte dintr-un text. Este una dintre cele mai simple metode de a masura diversitatea vocabularului folosit de un autor sau intr-un anumit text.
Un scor TTR mai mare inseamna ca textul contine mai multe cuvinte diferite (bogatie lexicala), iar un scor mai mic indica repetitivitate.
Cum se calculeaza TTR?
Formula este:
TTR = (numar cuvinte unice / numar total de cuvinte) × 100
Unde:
cuvinte unice (types) = fiecare cuvant distinct, indiferent de cate ori apare
cuvinte totale (tokens) = toate cuvintele, inclusiv repetitiile
Exemplu:
Un text cu 100 de cuvinte in total, dintre care 60 sunt unice →
TTR = (60 / 100) × 100 = 60%
Cum interpretam scorul TTR?
TTR este exprimat procentual. In general:
TTR mare = vocabular variat, expresiv
TTR mic = limbaj repetitiv, uneori intentionat (ex: stil oral, instructiuni)
Valoarea TTR scade in mod natural pe masura ce textul devine mai lung, de aceea comparatia intre texte trebuie facuta cu atentie (ideal, pe fragmente de aceeasi dimensiune).
TTR · Vocabular · Tip de text
> 80% · Extrem de variat · Poezie libera, metafore dense
70–79% · Foarte bogat · Eseuri creative, literatura originala
60–69% · Variat · Articole de opinie, povestiri narative
50–59% · Echilibrat · Bloguri, stiri, eseuri simple
40–49% · Moderat repetitiv · Recenzii, interviuri, dialoguri
30–39% · Repetitiv · Instructiuni, comunicate oficiale
< 30% · Sarac lexical · Slogane, limbaj robotizat
Exemple practice
TTR = 82% · Poem scurt, fiecare vers are un cuvant diferit
TTR = 67% · Editorial bine scris, cu sinonime si variatie stilistica
TTR = 51% · Articol informativ standard, cu ceva reluari
TTR = 36% · Manual de utilizare sau protocol tehnic repetitiv
Limite si utilitate
TTR este foarte sensibil la lungimea textului: textele scurte tind sa aiba scoruri TTR mai mari, chiar daca nu sunt foarte variate in realitate. Din acest motiv, in analiza stilometrica avansata se folosesc variante ajustate precum:
RTTR (Root TTR)
MATTR (Moving-Average TTR)
CTTR (Corrected TTR)
Totusi, TTR simplu este inca foarte util pentru comparatii rapide si pentru clasificarea generala a stilului lexical.
Concluzie
TTR este o unealta rapida si intuitiva pentru a evalua diversitatea vocabularului dintr-un text. Cu cat procentul este mai mare, cu atat textul este mai variat si expresiv. TTR nu spune totul despre stil sau calitate, dar este un punct excelent de plecare in analiza limbajului.