Identification de descripteurs pour la caract\'erisation de registres (Feature identification for register characterization)

L{'}article pr{\'e}sente une {\'e}tude des descripteurs linguistiques pour la caract{\'e}risation d{'}un texte selon son registre de langue (familier, courant, soutenu). Cette {\'e}tude a pour but de poser un premier jalon pour des t{\^a}ches futures sur le sujet (classification, extraction de motifs discriminants). {\`A} partir d{'}un {\'e}tat de l{'}art men{\'e} sur la notion de registre dans la litt{\'e}rature linguistique et sociolinguistique, nous avons identifi{\'e} une liste de 72 descripteurs pertinents. Dans cet article, nous pr{\'e}sentons les 30 premiers que nous avons pu valider sur un corpus de textes fran{\c{c}}ais de registres distincts.

PDF Abstract
No code implementations yet. Submit your code now

Tasks


Datasets


  Add Datasets introduced or used in this paper

Results from the Paper


  Submit results from this paper to get state-of-the-art GitHub badges and help the community compare results to other papers.

Methods


No methods listed for this paper. Add relevant methods here