Identification de descripteurs pour la caract\'erisation de registres (Feature identification for register characterization)
L{'}article pr{\'e}sente une {\'e}tude des descripteurs linguistiques pour la caract{\'e}risation d{'}un texte selon son registre de langue (familier, courant, soutenu). Cette {\'e}tude a pour but de poser un premier jalon pour des t{\^a}ches futures sur le sujet (classification, extraction de motifs discriminants). {\`A} partir d{'}un {\'e}tat de l{'}art men{\'e} sur la notion de registre dans la litt{\'e}rature linguistique et sociolinguistique, nous avons identifi{\'e} une liste de 72 descripteurs pertinents. Dans cet article, nous pr{\'e}sentons les 30 premiers que nous avons pu valider sur un corpus de textes fran{\c{c}}ais de registres distincts.
PDF Abstract