Traitement OCR
Résoluuniuc Messages postés 297 Date d'inscription samedi 23 juin 2007 Statut Membre Dernière intervention 18 avril 2025 - 15 avril 2025 à 14:53
- Traitement OCR
- Free ocr - Télécharger - Divers Bureautique
- Simple ocr - Télécharger - Bureautique
- Traitement de texte gratuit - Guide
- Traitement de texte gratuit open office - Télécharger - Suite bureautique
- Traitement texte pdf - Guide
8 réponses
14 avril 2025 à 09:03
Bonjour,
Je ne vois pas très bien l'apport de la tarte à la crème de l'IA en termes d'OCR.
Une seule chose est sûre, on n'obtient des résultats acceptables et encore (qualité du manuscrit, complexité du texte...) que par le biais de logiciels spécialisés qui non seulement ne sont pas gratuits mais très coûteux.
En toute hypothèse, les traitements sont longs, consomment des ressources processeur et RAM inconsidérées, doivent toujours être corrigés après la "proposition" de l'OCR...
Exprimé autrement et sauf si le texte est très long, on a sans doute plus vite fait de le ressaisir au kilomètre.
14 avril 2025 à 09:24
Perplexity est un moteur de recherche IA gratuit conçu pour révolutionner la façon dont vous découvrez l'information.
Posez n'importe quelle question, et il recherche sur Internet pour vous donner une réponse accessible, conversationnelle et vérifiable.
Ce n'est pas de l'OCR, reconnaissance de caractère,
-qui pourrait hésiter entre O et Q. Déjà il y a matière à commettre bien des erreurs.
Perplexity fabrique réellement des réponses à questions, avec tout ce qu'il a pu trouver sur internet, pas conçu pour respecter le sens d'un texte.
La qualité coûte cher, l'IA doit être entraîné et contrôlé dans le domaine où on va le faire travailler.
Modifié le 14 avril 2025 à 15:00
re: Il n'y a pas de secrets pour bien entraîner les outils informatiques, trouvé dans les
___________________
Principes de base pour entraîner un outil IA avec des textes:
"3. Faites traduire vos contenus par des natifs professionnels."
_______________
RAG pour ne pas inventer: le meilleur des 2 branches
la recherche d’informations (retrieval, qui ne génère pas de réponse originale) et la génération de contenu (qui ne s’appuie que sur les données de son apprentissage entraînement)
14 avril 2025 à 14:57
Bonjour,
Je n'ai pas compris cette phrase, enfin je ne suis pas certain de la comprendre :
"Faites traduire vos contenus par des natifs professionnels"
14 avril 2025 à 15:31
Si tu as bien compris, le conseil donné pour réussir est de "faire traduire les textes par des professionnels qui sont natifs"!.. ont toujours pratiqué et connaissent toutes les variantes locales usages coutumes contextes de la langue utilisée, en plus.
Modifié le 14 avril 2025 à 15:50
Ha ok, mais dans le cadre de la généalogie, ils sont certainement un peut mort les natifs.
Je vois que tu as fait un petit ajout sur le RAG, en fait le RAG, vois le plus comme une méthode d'utilisation de sources données. Quand tu as une base de données vectoriel ça permet d'interroger le modèle de façon à ce qu'il se focalise exclusivement sur ces données.
https://www.ibm.com/fr-fr/think/topics/vector-database
Par exemple en généalogie, ça pourrait être intéressent pour retrouver les filiations, ou les déplacements géographiques à un instant 'T' et j'en passe.
14 avril 2025 à 11:16
OK mais vers quoi nfaut-il se tourner pour avoir de l'OCR? et pas ,trop cher ?
Merci
Modifié le 14 avril 2025 à 12:09
Bonjour,
Si tu as un abonnement chez free mobile sinon il suffit de prendre un abonnement à 2€ chez eux et d'activer les 12 mois gratuits de chez mistral AI.
Mistral c'est plus un outil qu'un LLM.
C'est son job l'OCR et le RAG et pour ne rien gâcher il y as de la doc et un discord
Vous n’avez pas trouvé la réponse que vous recherchez ?
Posez votre question14 avril 2025 à 14:15
Ca a l'air top et je suis ,chez Free et je m'étais inscrit à mistral ai gratuit un an§
mais je suis un peu perdu : RAG, DISCORD, LLM... Où est la doc ?
Peux-tu me dire par où commencer et en particulier comment faire pour extraire du texte (OCR) d'un jpeg ou pdf?
Merci d'avance car c'est ce que je cherche
C'est top.
14 avril 2025 à 14:35
Donc,
Ici tu as ton home
https://console.mistral.ai/home
Tout en bas tu va voir les doc, celle qui t’intéresse c'est ici
https://docs.mistral.ai/capabilities/document/#ocr-with-image
le liens du discord il est en bas à droite de cette même page. Je te pose quand même le lien.
Tout est expliqué dans la doc, par contre ça va te demander de te créer un petit environnement python, selon ta config tu as plusieurs choix.
Modifié le 14 avril 2025 à 14:46
Ok donc ça ne veut pas que je te réponde sur le forum ça me colle -1 d'office et ça vire mon texte lol je te MP
14 avril 2025 à 15:19
Bonjour,
J'ai rétabli le message, supprimé par le robot.
Merci de continuer sur le forum : l'aide en MP n'est pas acceptable.
14 avril 2025 à 15:21
Merci, je ne voyais pas trop comment faire autrement.
Et c'est due à quoi au lien discord ?
14 avril 2025 à 15:23
Oui c'est ce lien. Je vais voir ce qui motive la suppression.
15 avril 2025 à 14:53
Une jalousie entre logicielles lol
Mais bon comme çà je sais que coller les liens discorde ça ne le fait pas, après tout ce n'est pas si grave.
15 avril 2025 à 09:05
Bonjour,
et merci à uniuc pour ce bel effort, très complet.
Deux remarques : cet soluce a l'air gratuite (pour un an chez free, très bien) , mais par contre complexe et hélas à 80 ans je ne vais pas me mettre un python dans le cou(p)!
Merci et on peut clore le sujet
Modifié le 15 avril 2025 à 14:51
Bonjour,
Je comprend, après comme le dit à juste tire brucine si il n'y à pas des kilomètres de texte il serais peut être plus rapide de le faire sur papier ou même au clavier.