Java-découpage de String

Question

Bonjour,

 Pour les besoins d'un programme qui va traiter des phrases entrées au clavier par l'utilisateur ("Si tu as le temps, tu peux venir avec moi." par exemple). J'aurai besoin de récupérer chaque mot et aussi les signes de ponctuation ( la virgule "," et le point "." dans la phrase d'exemple) pour pouvoir les traiter ultérieurement.

 J'ai regardé la classe StringTokenizer qui semble correspondre à mes besoins, mais on a l'air de pouvoir lui donner qu'un seul type de délimitateur. Comme je lui demande au minimum comme délimitateur l'espace, je récupère comme mot "temps," au lieu de récupérer "temps" puis ",". De même à la fin de la phrase je récupère la String "moi." au lieu de "moi" puis "." .
 Faut-il  mieux que je crée de toute pièce un objet plus puissant que le StringTokenizer de base  admettant plusieurs types différents de délimitateurs, ou alors je repasse sur chaque mot renvoyé avec un StringTokenizer configuré pour séparer  les signes de ponctuation des mots? Dans ce dernier cas, ça implique certainement de devoir passer chaque mot à travers un série de StringTokenizer configurés chacun pour un type de ponctutation : un pour le point, l'autre pour la virgule, le point virgule, le point d'interrogation...
 
 En vous remerciant par avance

Confus · Answer

Personnellement à ta place je stockerais les résultats de ton tokenizer par les espace dans un tableau de String.

Ensuite il te reste juste à comparer le dernier charactere de chaque mot de ton tableau avec un tableau de charactere ou tu aurais mis l'ensemble des ponctuation que tu veux extraire. Quand ca correspond tu le retires du mot et tu le stock à part.

danimo · Answer

Salut,

Tu peux essayer comme ci-dessous:


         String unePhrase = "Si tu as le temps, tu peux venir avec moi.";
         String unePhrase2 = unePhrase.replaceAll(",", " ,");
         System.out.println("la phrase : " + unePhrase);
         unePhrase2 = unePhrase.replaceAll("\.", " \.");
         System.out.println("la phrase : " + unePhrase);
      
         StringTokenizer chaine;
         chaine = new StringTokenizer(unePhrase2);
         while (chaine.hasMoreTokens()) {
            String tok = chaine.nextToken(); // stocker par exemple dans un tableau
            System.out.println("tok = " + tok);
         }
      Cordialement,

Dan

danimo · Answer

Désolé il y a un petit problème:

String unePhrase = "Si tu as le temps, tu peux venir avec moi."; 
String unePhrase2 = unePhrase.replaceAll(",", " ,"); 
System.out.println("la phrase : " + unePhrase); 
//unePhrase2 = unePhrase.replaceAll("\.", " \.");  ligne remplacée par la ligne suivante
unePhrase2 = unePhrase2.replaceAll("\.", " \."); 
System.out.println("la phrase : " + unePhrase); 

StringTokenizer chaine; 
chaine = new StringTokenizer(unePhrase2); 
while (chaine.hasMoreTokens()) { 
String tok = chaine.nextToken(); // stocker par exemple dans un tableau 
System.out.println("tok = " + tok); 
} 
Cordialement, 

Dan

Java-découpage de String

3 réponses

Discussions similaires

Newsletters