Adaptation par enrichissement terminologique en traduction automatique statistique fond\'ee sur la g\'en\'eration et le filtrage de bi-segments virtuels
Nous pr{\'e}sentons des travaux pr{\'e}liminaires sur une approche permettant d{'}ajouter des termes bilingues {\`a} un syst{\`e}me de Traduction Automatique Statistique (TAS) {\`a} base de segments. Les termes sont non seulement inclus individuellement, mais aussi avec des contextes les englobant. Tout d{'}abord nous g{\'e}n{\'e}rons ces contextes en g{\'e}n{\'e}ralisant des motifs (ou patrons) observ{\'e}s pour des mots de m{\^e}me nature syntaxique dans un corpus bilingue. Enfin, nous filtrons les contextes qui n{'}atteignent pas un certain seuil de confiance, {\`a} l{'}aide d{'}une m{\'e}thode de s{\'e}lection de bi-segments inspir{\'e}e d{'}une approche de s{\'e}lection de donn{\'e}es, pr{\'e}c{\'e}demment appliqu{\'e}e {\`a} des textes bilingues align{\'e}s.
PDF Abstract