Le French QuestionBank est un corpus composé de près de deux milles questions provenant de domaines variés (jeu de donnée TREC, organisme gouvernementaux français et d'ONG, etc.). Il est annoté en : (i) morphosyntaxe (partie du discours, lemmes) and (ii) syntaxe de surface (constituents et dépendances) avec dépendances longues distances.
La partie TREC est aligné avec le QuestionBank de l'anglais (Judge et al, 2006).