Ce projet a été l’occasion de découvrir l’Intelligence Artificielle à travers des problèmes d’apprentissage à ressource limitée en Traitement des Langues.
Programme
Un programme d’entraînement avec PyTorch a été mis en place pour reconstruire des mots anciens dans une langue mère à partir d’informations sur des langues admises comme étant ses filles. Des algorithmes de génération à partir de graphes combinatoires ont pu être implémentés de manière vectorisée. La complexité importante du nombre d’échantillons à chaque itération d’espérance-maximisation a cependant causé un bottleneck dans la pipeline d’exécution, empêchant un entraînement d’être abouti comme prévu dans le papier concerné. Le manque de matériel GPU a aussi contribué a l’impossiblité de terminer l’expérience.
L’usage de Jupyter a été notoire pour présenter l’expérience.
Rapport et soutenance
Démarche de vulgarisation du sujet et soutenance de nos travaux avec les félicitations du jury.