Creer un tableaux ordonné par mots

Fermé
neocol Messages postés 63 Date d'inscription mardi 4 juin 2013 Statut Membre Dernière intervention 6 février 2016 - 21 mars 2014 à 21:42
Bonjour,

j'ai un fichier data_set.txt qui contient :

ligne 1: bergrac milk
ligne 2: cheverny milk scallop
ligne 3: bergrac milk oyster
ligne 4:montlouis oyster
ligne 5:salad
ligne 6:montlouis

j'ai créé ce code :
package générer_tableau;

import java.io.*;
import java.util.*;
public class Str
{
public static void main (String[]args)
{
try
{
BufferedReader bfr = new BufferedReader (new FileReader ("data_set.txt" ));
String line;
Map maMap = new HashMap();
Integer Mot = new Integer(1);
int compteur =0;
List namesList = new ArrayList();
String Word;

while ((line = bfr.readLine())!= null)
{
compteur++;
String [] tokens = line.split(" ");
int i = 0;
while (tokens.length > i)
{
Word = tokens[i++];
//System.out.println("tenken : " + tokens) ;

Word = Word.toLowerCase();
Word = Word.replaceAll("[^a-z]","" );
System.out.println("word : " + Word) ;

if(Word.length()>2)
{
if (maMap.containsKey(Word)== false )
{
maMap.put(Word, Mot);
//System.out.println("maMap 1 :" +maMap);
namesList.add(Word);
}

else
{
String nombre_key = maMap.get(Word).toString();
//System.out.println("nombre_key : " + nombre_key) ;
Integer MotStoke = new Integer(nombre_key);
int temp = Mot.intValue()+ MotStoke.intValue();
//System.out.println("temp : " + temp) ;
Integer nbMot = new Integer (temp);
Mot.toString();
// System.out.println("word1 : " + Mot) ;
maMap.remove(Word);
maMap.put(Word, nbMot);

//System.out.println("ts : " + ts) ;
}
}
}
}
System.out.println(maMap);
System.out.println("nombre de lignes : " + compteur) ;
Collections.sort(namesList);
System.out.println("namesList :" + namesList);
System.out.println("namesList size :" + namesList.size());


}
catch (Exception e) {
System.out.println(e);
}
}
}


A la fin je récupére les mots qui existent sans doublons :
namesList :[bergrac, cheverny, milk, montlouis, oyster, salad, scallop]
la taille de namelist est 7
et je récupére le nombre de lignes qui 6 (compteur dans le code)


maintenant je veux créer un tableau de 0 et 1, tels que les colonnes sont les nameList avec un nombre de lignes qui est le 'compteur', mais je veux que les les mots deviennent 0 et 1 et à chaque lignes ils gardent la même colonne, et 1 ça veu dire il esxiste dans une telle ligne 0 non

c-àd à la fin je veux récupérer :
data_set.txt
ligne 1 : 1 0 1 0 0 0 0
ligne 2 : 0 1 1 0 0 0 1
...

J'aime bien avoir votre aide, une idée ou un code, j'en serai preneur.
All the best,
Youness Mourtaji