Lemmatiser une phrase

Fermé
noussa90 - Modifié par noussa90 le 19/04/2013 à 00:49
Bonsoir,

Quelqu'un peut m'aider à réduire un mot en français à sa forme canonique. Par exemple "travailleurs" ==> "travail". J'ai cherché et j'ai trouver qu'il existe un lemmatiseur qui s'appelle TreeTagger qui peut résoudre mon problème. Ci-dessous mon code que je n'arrive toujours pas à le compiler.


package treetagger;
import org.annolab.tt4j .*;
import java.io.IOException;
import java.util.Vector;

public class lemmatiser {
public lemmatiser (){

Vector<String> o=new Vector<String>();
TreeTaggerWrapper tt = new TreeTaggerWrapper();
try {
o.add("this");
tt.setModel("C:/TreeTagger/models/fr.par:iso8859-1");
tt.setHandler(new TokenHandler() {
void token(String token, String pos, String lemma) {
System.out.println(token+"\t"+pos+"\t"+lemma);
}


public void token(Object arg0, String arg1, String arg2) {
// TODO Auto-generated method stub

}
});

tt.process(o);
} catch (TreeTaggerException e) {

e.printStackTrace();
}
catch (IOException e) {

e.printStackTrace();
}
finally {
tt.destroy();
}
}
public static void main(String[] args){
new lemmatiser ();
}
}

Merci de me répondre.