Indexation et appariement de documents cliniques avec le mod\`ele vectoriel (Indexing and matching clinical documents using the vector space model)

JEPTALNRECITAL 2019 · Khadim Dram{\'e}, Ibrahima Diop, Lamine Faty, Birame Ndoye ·

Dans ce papier, nous pr{\'e}sentons les m{\'e}thodes que nous avons d{\'e}velopp{\'e}es pour participer aux t{\^a}ches 1 et 2 de l{'}{\'e}dition 2019 du d{\'e}fi fouille de textes (DEFT 2019). Pour la premi{\`e}re t{\^a}che, qui s{'}int{\'e}resse {\`a} l{'}indexation de cas cliniques, une m{\'e}thode utilisant la pond{\'e}ration TF-IDF (term frequency {--} inverse document frequency) a {\'e}t{\'e} propos{\'e}e. Quant {\`a} la seconde t{\^a}che, la m{\'e}thode propos{\'e}e repose sur le mod{\`e}le vectoriel pour apparier des discussions aux cas cliniques correspondants ; pour cela, le cosinus est utilis{\'e} comme mesure de similarit{\'e}. L{'}indexation s{\'e}mantique latente (latent semantic indexing {--} LSI) est {\'e}galement exp{\'e}riment{\'e}e pour {\'e}tendre cette m{\'e}thode. Pour chaque m{\'e}thode, diff{\'e}rentes configurations ont {\'e}t{\'e} test{\'e}es et {\'e}valu{\'e}es sur les donn{\'e}es de test du DEFT 2019.

PDF Abstract

Code

Add Remove Mark official

No code implementations yet. Submit your code now

Tasks

Add Remove

Datasets

Add Datasets introduced or used in this paper

Results from the Paper

Add Remove

Submit results from this paper to get state-of-the-art GitHub badges and help the community compare results to other papers.

Methods

Add Remove

No methods listed for this paper. Add relevant methods here

Edit Social Preview

Indexation et appariement de documents cliniques avec le mod\`ele vectoriel (Indexing and matching clinical documents using the vector space model)

Code Edit Add Remove Mark official

Tasks Edit Add Remove

Datasets Edit

Results from the Paper Edit Add Remove

Methods Edit Add Remove

Code

Add Remove Mark official

Tasks

Add Remove

Datasets

Results from the Paper

Add Remove

Methods

Add Remove