[WORD-WRITTER] problème tri traitement texte

Fermé
jfc83300 - 20 janv. 2011 à 17:56
Raymond PENTIER Messages postés 58760 Date d'inscription lundi 13 août 2007 Statut Contributeur Dernière intervention 15 décembre 2024 - 21 janv. 2011 à 21:55
Bonjour,
Je travaille sur ma thèse (environ 1000 pages, 18000 phrases, etc... GROS VOLUME).
Certaines phrases (copier-coller légèrement modifiés au fil des remaniements, etc...) se ressemblent beaucoup, mais elles sont disséminées ça et là dans le document.

Pour les trouver, je sélectionne l'ensemble du texte, puis lance le tri par ordre alphabétique. Je vais avoir, au milieu de mes 1000 pages triées alphabétiquement, des passages du genre :

"Ces jolies fleurs sont appelées des roses"
"Ces jolies fleurs sont des roses"
"Ces jolies fleurs sont des roses rouges"
"Ces très jolies fleurs sont appelées des roses"
"Ces très jolies roses sont au nombre de 3"

Trop long pour un tel volume de rechercher phrase par phrase les mots similaires, puis de les modifier / remplacer / effacer. Temps évalué : 30 heures minimum.

Quelqu'un sait-il comment numéroter fictivement les lignes (ou équivalent) PUIS effectuer le tri alphabétique, tout cela rapidement (je ne tiens pas à faire 18000 copier-coller dans des cases excel ou autres...).

ATTENTION :
Les numéros de lignes ajoutés (ou équivalent) doivent donc pouvoir être compris par Word ou writter -openoffice- comme des critères de tri valides !!


exemple : après numérotation et tri, je vais avoir :

ligne 143, "Ces jolies fleurs sont appelées des roses"
ligne 5145, "Ces très jolies fleurs sont appelées des roses"
ligne 2248, "Ces jolies fleurs sont des roses"
ligne 883, "Ces très jolies roses sont au nombre de 3"
ligne 13030, "Ces jolies fleurs sont des roses rouges"

Dans le document trié alphabétiquement, je voudrais pouvoir modifier la ligne 143 (première à apparaître dans mon texte) puis supprimer les autres très rapidement (souris surligne + suppr).
J'aurais ainsi à la première occurrence le bilan "Ces trois jolies fleurs rouges sont appelées des roses", et plus rien après pour éviter les répétitions...

Une fois les modifications et suppressions effectuées sur le document trié alphabétiquement, il sera impératif que je puisse effectuer un nouveau tri, mais cette fois alphanumérique, pour remettre mon document dans l'ordre de lecture normal (phrase 1, puis 2, 6, 7, 11 (5 lignes ont été effacée précédemment, elles n'apparaissent plus dans le document final), etc ....

LES NUMEROS DE LIGNE NE DEVRONT ABSOLUMENT PAS APPARAITRE DANS LE DOCUMENT FINAL.

Merci d'avance !!
JFC

ps : J'ai essayé de convertir mon texte en 1 gigantesque tableau de 18000 cases, puis de rajouter une colonne, de numéroter les cases de cette deuxième colonne pour m'en servir de critère de tri numérique, ... mais le document est trop lourd. Les programmes refusent, plantent l'ordi, bla bla bla...

A voir également:

2 réponses

Raymond PENTIER Messages postés 58760 Date d'inscription lundi 13 août 2007 Statut Contributeur Dernière intervention 15 décembre 2024 17 253
21 janv. 2011 à 21:55
1) Pourquoi des milliers de recherches et de copier-coller ?
Tu connais ta thèse presque par coeur, et tu sais pertinemment quels sont les 50 ou 100 termes qui risquent d'être répétés trop souvent ...

2) Au lieu de cette numérotation fictive et de ces tris réels, pourquoi ne pas utiliser les index ? Tu crains que "jolies fleurs" apparaisse trop souvent ; tu sélectionnes "jolies fleurs" et dans Références/Index tu marques une entrée d'index, en spécifiant "Marquer tout". Tu recommences pour tous les termes ou expressions suspects d'être redondants. Quand tu crées ta liste d'index, tu obtiens en dernière page du document une liste de toutes ces locutions avec le N° des pages où elles figurent. Tu peux alors décider de les conserver, de les modifier ou de les supprimer.

3) Tu n'as toujours précisé la version du logiciel que tu utilises ...

Cordialement.
0
Raymond PENTIER Messages postés 58760 Date d'inscription lundi 13 août 2007 Statut Contributeur Dernière intervention 15 décembre 2024 17 253
20 janv. 2011 à 21:14
Bonjour.

Pour avoir aidé 3 personnes à mettre en forme définitive leur thèse (ou équivalent), je suis effaré de la procédure que tu as cru devoir employer !

Si tu as la version 2010 de Word, c'est d'une facilité déconcertante, avec le volet de recherche à gauche de l'écran.

Avec la version 2007 (ou antérieure), tu utilises l'utilitaire Rechercher et tu tapes "jolies fleurs" pour en atteindre successivement toutes les occurrences ; tu recommences avec "des roses".

De cette manière tu ne bouleverses absolument pas ton document avec des tris et des numérotations de lignes. Qu'en dis-tu ?

Cordialement.
-1
C'est justement la solution que je veux EVITER, pour ne pas avoir à effectuer des milliers et des milliers de copier_coller dans l'outil de recherche puis au moins 2500 recherches de similarités puis 2500 fois "surligner, effacer", etc... d'autant que je n'aurai pas au préalable compilé les infos si j'efface les messages qui sont presque semblables (cf fleurs qui deviennent "3 roses rouges" dans mon message)... mais merci quand même. Je fais déjà ça depuis quelques semaines, en attendant mieux...
0