Création de questions automatiquement

Résolu/Fermé
Enygma - 7 nov. 2021 à 15:52
 Enygma - 11 nov. 2021 à 14:34
Bonjour a tous,

Je voudrais savoir si il y aurait un moyen de "générer" des questions sur n'importe quel sujet ?

Je m'explique je suis actuellement sur la création d'une
dataset
pour un réseaux de neurone qui doit reconnaître si une phrase est interrogative ou pas, pour sa il faut que j’entraîne se réseaux avec des millier des questions différentes et vous l'aurez compris c'est la que sa coince...

J'avais d'abord penser a utilisée une chaîne de Markov pour générer ces questions, mais je me suis rendu compte que sa fonctionnait sur le même principe que les réseaux de neurones (besoins d'importer des données d'entrainement pour mon cas des questions).

Enfin bref si quelqu'un a une idée je suis preneur.

Merci d'avance pour vos réponse !

Enygma
A voir également:

3 réponses

yg_be Messages postés 23352 Date d'inscription lundi 9 juin 2008 Statut Contributeur Dernière intervention 27 novembre 2024 Ambassadeur 1 554
Modifié le 7 nov. 2021 à 19:37
bonjour,
dans ton contexte, penses-tu que cela a du sens d'entrainer ton réseau sur des phrases aléatoires?
ne penses-tu pas qu'il faut l'entrainer sur des phrases réelles?
n'est-il pas utile également de lui donner un moyen de différencier les phrases interrogatives?

connais-tu GIGO?
0
Bonsoir yg_be,

Je me suis peut-être mal exprimé, se que j'entends par aléatoire c'est des questions de tout les types personnel(comment vas ta famille ?) Professionnelle(quel est le budget de Mr dupont ?)...

Justement c'est le but du réseau de neurones mais pour ça je dois l'entraîner à reconnaître les phrases interrogative.

Non je ne connais malheureusement pas GIGO.

Enygma
0
yg_be Messages postés 23352 Date d'inscription lundi 9 juin 2008 Statut Contributeur Dernière intervention 27 novembre 2024 1 554 > Enygma
7 nov. 2021 à 21:03
je pense que tu dois t'entrainer sur des questions existantes, pas sur des questions générées.

gigo: si tu fournis n'importe quoi en entrée, tu auras n'importe quoi en sortie.
0
Enygma > yg_be Messages postés 23352 Date d'inscription lundi 9 juin 2008 Statut Contributeur Dernière intervention 27 novembre 2024
7 nov. 2021 à 21:16
J'aimerais bien, mais une réseau de neurones requièrent des centaines voir des milliers de données (phrases) pour être correctement entraîner.
Et je suis pas vraiment chaud et les écrire une par une, j'en suis venu à la conclusion que le "seul" moyen d'après moi serait de générer ces phrases via un programme, mais lequel.
0
yg_be Messages postés 23352 Date d'inscription lundi 9 juin 2008 Statut Contributeur Dernière intervention 27 novembre 2024 1 554 > Enygma
8 nov. 2021 à 08:55
Si tu dois avoir des milliers de questions différentes, je pense que le mieux, c'est d'extraire ces questions de textes écrits par des humains.
Tu devrais pouvoir obtenir cela en une journée de travail.
0
Enygma > yg_be Messages postés 23352 Date d'inscription lundi 9 juin 2008 Statut Contributeur Dernière intervention 27 novembre 2024
8 nov. 2021 à 12:25
Mais a ton avis il y aurait pas une solution plus rapide ??
Parce que j'ai plusieur réseaux à entraîner et sur des dataset du même type...
0
cassiusvinicius
8 nov. 2021 à 18:45
Cite: "doit reconnaître si une phrase est interrogative".
Une phrase interrogative se termine par un point d'interrogation (en général...).
Nul besoin de neurones (un seul suffit) pour détecter le dit point.
0
Bonjour cassiusviniclus,

Je vais vous expliquer concrètement se que je veux faire.
Mon but final est de pouvoir créer un assistance vocale amélioré.

Je m'explique j'ai récemment eu l'idée de construire une architecture de réseaux de neurones en arborescence, dans le but d'améliorer la compréhension pour l'assistant vocal.

Cela repose sur le principe d'affinement c'est à dire que un réseau vas recevoir une phrase émise par l'utilisateur (grâce à un logiciel de reconnaissance vocal qui malheureusement ne prend pas en compte les point d'interrogation), et qui vas d'abord déterminer de grande catégorie, si la phrase est une question, ou bien un ordre (du style ouvre internet, connecte toi au système...).

Une fois la prédiction du réseaux effectué, en fonction de cette prédiction un autre réseau de neurone vas analyser une nouvelle fois la la question (pour notre exemple) pour analyser quel type de question c'est (questions "bienveillantes" (comment vas-tu ?...) ou une question cachant un ordre (pourrait-tu Calculer 2 + 2 ?)) Dans se cas la pseudo question sera renvoyé dans la catégorie ordre...

Et quand la question aura été assez affinés un RNN (réseau de neurone récurrent) se tâchera de comprendre se que veux dire la question, et renverra une réponse adapter à la question.

Mais pour cela il me faut entraîner les réseaux avec un dataset précise et adapter à chaque réseau, d'où l'idée du générateur de phrase (je ne pourrais pas écrire manuellement des centaines de milliers de phrases, ou les récupère sur internet sa me prendrait des années...).

Voilà mon but.

Enygma
0
yg_be Messages postés 23352 Date d'inscription lundi 9 juin 2008 Statut Contributeur Dernière intervention 27 novembre 2024 1 554 > Enygma
9 nov. 2021 à 10:38
Ton réseau doit donc apprendre comment une population d'humains s'exprime verbalement.

Tu pourrais utiliser la suggestion de cassiusvinicius, et écrire un programme qui analyse des textes, et extrait les phrases se terminant par un point d'interrogation.

Comme les humains ne parlent pas comme ils écrivent, il est préférable que ces textes soient des dialogues, par exemple des pièces de théâtre ou des transcriptions de conversations.

Ignorais-tu qu'entrainer un réseau de neurones était un travail immense, qui consomme la majeure partie du budget de ce genre de projet, et qui détermine le succès ou l'échec du projet?
0
cassiusvinicius > yg_be Messages postés 23352 Date d'inscription lundi 9 juin 2008 Statut Contributeur Dernière intervention 27 novembre 2024
10 nov. 2021 à 11:56
Exactement; tu mets tes vocaux en textes, et le tour est joué avec le point d'interrogation
0
Merci pour vos réponses !

Se sujet a été résolut
0