Apprentissage en ligne interactif d'un g\'en\'erateur en langage naturel neuronal pour le dialogue homme-machine (On-line Interactive Learning of Natural Language Neural Generation for Human-machine)
R{\'e}cemment, de nouveaux mod{\`e}les {\`a} base de r{\'e}seaux de neurones r{\'e}currents ont {\'e}t{\'e} propos{\'e}s pour traiter la g{\'e}n{\'e}ration en langage naturel dans des syst{\`e}mes de dialogue (Wen et al., 2016a). Ces mod{\`e}les demandent une grande quantit{\'e} de donn{\'e}es d{'}apprentissage ; or la collecte et l{'}annotation de ces donn{\'e}es peuvent {\^e}tre laborieuses. Pour r{\'e}pondre {\`a} cette probl{\'e}matique, nous nous int{\'e}ressons ici {\`a} la mise en place d{'}un protocole d{'}apprentissage en ligne bas{\'e} sur un apprentissage par renforcement, permettant d{'}am{\'e}liorer l{'}utilisation d{'}un mod{\`e}le initial appris sur un corpus plus restreint g{\'e}n{\'e}r{\'e} par patrons. Dans cette {\'e}tude exploratoire, nous proposons une approche bas{\'e}e sur un algorithme de bandit contre un adversaire, afin d{'}en {\'e}tudier l{'}int{\'e}r{\^e}t et les limites.
PDF Abstract