Ce este Yule’s K?
Yule’s K este un indice stilometric care masoara bogatia vocabularului dintr-un text. A fost propus de George Udny Yule, un statistician britanic, in anii 1940, ca parte a cercetarilor sale despre diversitatea lexicala si structura limbajului scris.
Scorul K este interesant pentru ca nu se bazeaza doar pe proportia de cuvinte unice, ci ia in calcul distributia frecventei cuvintelor, oferind o estimare mai precisa a repetitiei lexicale. A devenit popular in domenii precum analiza stilului literar, lingvistica computationala si detectarea autorilor.
Cum se calculeaza Yule’s K?
Formula matematica este:
K = 10.000 × (M2 - N) / N²
Unde:
N = numarul total de cuvinte din text (tokens)
M2 = suma ponderata a patratelor frecventelor cuvintelor
Calculul poate parea complex, dar in esenta se bazeaza pe cat de des se repeta cuvintele:
Daca un cuvant apare de 1 data → este considerat rar.
Daca apare de 10 ori → contribuie masiv la valoarea K.
Un text in care multe cuvinte se repeta des va avea un K mai mare, semn ca vocabularul este sarac sau redus.
Cum interpretam scorul Yule’s K?
Yule’s K variaza de obicei intre 30 si 150, in functie de lungimea si complexitatea textului. Spre deosebire de LIX, aici un scor mai mic este mai bun, semnaland un vocabular mai bogat si variat.
| Yule’s K · Interpretare · Tip de text · Exemplu |
< 40 · Extrem de variat · Poezie moderna, eseuri creative
40–50 · Foarte bogat · Literatura de calitate, editoriale
51–60 · Echilibrat · Ziar serios, recenzii, articole lungi
61–70 · Moderat simplu · Bloguri, comunicate, discursuri
71–80 · Repetitiv · Manuale, instructiuni, documente simple
81–90 · Sarac lexical · Publicitate, dialoguri comerciale
> 90 · Extrem de repetitiv · Slogane, texte robotice, comenzi vocale
Exemple practice
K = 38 · Fragment poetic cu multe imagini si metafore, aproape fara repetitii
K = 55 · Editorial echilibrat, folosind sinonime si exprimare variata
K = 72 · Comunicat de presa, cu multe verbe repetitive si structuri standard
K = 95 · Reclama cu 3-4 cuvinte-cheie repetate obsesiv
Limite si utilitate
Yule’s K nu masoara complexitatea gramaticala sau ideatica, ci repetitia lexicala. Este extrem de util pentru a compara texte diferite sau pentru a observa stilul unui autor.
De exemplu:
Autori literari au scoruri K mici (vocabular bogat);
Texte institutionale sau automate au scoruri K mari.
Este adesea folosit impreuna cu alti indicatori, cum ar fi LIX sau TTR (type-token ratio), pentru o analiza stilistica mai completa.
Concluzie
Yule’s K este un indicator valoros pentru cei interesati de limbaj, scris, creativitate si analiza stilului. Cu cat scorul este mai mic, cu atat textul este mai viu, mai divers si mai placut de citit. Este o unealta subtila, dar revelatoare, pentru toti cei care vor sa inteleaga mai bine cat de "bogat" este limbajul folosit.