Punctuatie
Indicatorul “Punctuatie” masoara frecventa semnelor de punctuatie dintr-un text si reflecta stilul de redactare, ritmul si complexitatea frazelor folosite de autor.
Un stil fragmentat, expresiv sau retoric va avea un scor diferit fata de unul sobru, concis sau tehnic.
Cum se calculeaza?
Punctuatia este exprimata ca procent din totalul cuvintelor din text:
Acest procent arata cata punctuatie apare, in medie, per cuvant, si este numeric identic cu normalizarea "per 100 de cuvinte". Asadar, o valoare precum “10” poate fi interpretata fie ca “10 semne de punctuatie la 100 de cuvinte”, fie ca “10% punctuatie”. Alegeti varianta care vi se pare mai naturala sau mai usor de inteles.
NB: Desi este exprimat in procente, acest indicator nu reflecta procentul din totalul caracterelor, ci frecventa raportata la cuvinte.
De ce nu normalizam punctuatia dupa caractere sau propozitii?
Caracterul (litere, spatii, cifre) nu este o unitate de expresie semnificativa in stilometrie. De exemplu in limba germana, cuvintele tind sa fie mai lungi decat in romana, dar asta nu inseamna ca are mai putina punctuatie, de aceea normalizarea pe caractere ar fi inselatoare.
Propozitiile pot varia enorm in lungime. Un text poetic poate avea o propozitie pe 3 randuri, iar un text legal — 10 propozitii intr-un singur paragraf.
Normalizarea pe cuvinte este cea mai stabila si relevanta metoda.
Ce semne de punctuatie sunt incluse?
Lista caracterelor analizate de obicei:
.
— punct (final de propozitie),
— virgula (stil fragmentat, fraze lungi);
— punct si virgula (stil formal, academic):
— doua puncte (structurare interna)?
— semn de intrebare (interogativ, retoric)!
— semn de exclamare (emotie, expresivitate)—
sau–
— liniuta lunga sau scurta (stil colocvial, parantetic)...
— puncte de suspensie (ezitare, stil narativ subiectiv)"
si'
— ghilimele (dialog, citate)()
— paranteze (explicatii)
In unele cazuri se pot analiza si:
/
— limbaj tehnic, date@
,#
— text social media*
,_
— accentuare in stil markdown
Ce poate releva acest indicator?
Autori care abuzeaza de punctuatie (
!!!
,...
,?!
) pot avea un stil informal, expresiv sau dezorganizat.Texte sobru redactate (rapoarte, comunicate) vor avea o punctuatie discreta si echilibrata.
Punctuatia poate contribui la identificarea autorului, clasificarea textului si detectarea stilurilor simulate (inclusiv AI vs. uman). De exemplu textele generate de AI abunda in “—”, in timp ce autorii umani le folosesc mult mai rar.