Périphérique et transcription sur Nuance Dragon

Signaler
Messages postés
40
Date d'inscription
jeudi 1 juin 2017
Statut
Membre
Dernière intervention
16 février 2021
-
Messages postés
6745
Date d'inscription
lundi 31 janvier 2011
Statut
Contributeur
Dernière intervention
24 février 2021
-
Bonjour, j'ai installé tout récemment le logiciel Nuance Dragon et je dois dire qu'il y a des choses qui m'échappent totalement. L'action consistant à parler dans ton microphone et à obtenir des phrases dictées directement sur un logiciel de traitement de texte, ceci ne pose aucun problème. Mais moi je souhaiterais plutôt dicter des audios extérieurs, via le mixage stéréo (en supposant que c'est possible avec ce logiciel). Un peu semblable donc à ce que peut faire la "saisie vocale" de Google Docs. Lors de l'installation, j'ai eu certes la possibilité de choisir le mixage stéréo à la place du microphone (cf. ci-dessous), mais ceci ne marchait pas

L'étape obligatoire de configuration vocale du microphone ne pouvait qu'échouer (cf. ci-dessous) puisque le mixage stéréo ne peut pas capter ta voix. J'étais donc obligé pour finaliser l'installation du logiciel de choisir par défaut le microphone, pour valider cette étape

Maintenant que l'inscription est finalisée, j'ai l'impression malheureusement qu'on ne peut pas revenir en arrière sur le choix du périphérique d'entrée, qui est dans mon cas bloqué sur le microphone. Déjà comme première question, y a t-il un quelconque moyen pour revenir en arrière, pour choisir à la place le mixage stéréo (sans être obligé de désinstaller-réinstaller) ? Et par extension, que faut-il faire pour que ce dernier fonctionne lors de la configuration vocale ?


Autre problématique : au sujet cette fois de l'outil "transcrire un enregistrement". L'intérêt ici est d'envoyer un fichier audio afin de le convertir en texte sur un logiciel de traitement de texte quelconque (Word dans mon cas). J'ai eu l'occasion de faire plusieurs essais et d'avoir des acceptations différentes. J'ai testé d'abord avec un court audio de 3 minutes et j'obtiens le message de validation suivant :

Juste que là pas trop de problème, même si le texte retranscrit sur Word est très lacunaire (l'audio pourtant n'était pas spécialement de mauvaise qualité). Maintenant un deuxième essai avec cette fois un audio d'1h30 et qui provient d'une conférence que j'avais enregistré. Là j'obtiens un message d'erreur :

Les explications ici indiquent un format non valide (alors que c'est un fichier MP3) et une "fréquence d'échantillonnage" minimale à respecter (paramètre totalement obscur pour moi). L'échec de cette seconde transcription provient de la longueur du fichier ou d'un autre paramètre dont j'ignore ?

1 réponse

Messages postés
6745
Date d'inscription
lundi 31 janvier 2011
Statut
Contributeur
Dernière intervention
24 février 2021
1 637
Bonjour,

J'ai hésité à avancer des suggestions, sachant qu'en ce moment des intervenants sont plus prompts à condamner l'énoncé d'absence de solutions connues qu'à apporter leurs solutions miraculeuses.

Mais il faut vivre dangereusement et sans doute d'autres utilisateurs proposeront leur expérience.

Ayant testé ce logiciel il y a quelque temps, dune version à l'autre, le temps de reconnaissance a été réduit mais ne peut être à ma connaissance complètement annulé.

Cette étape n'existe pas quand vous énoncez:

audio d'1h30 et qui provient d'une conférence que j'avais enregistré. Là j'obtiens un message d'erreur

Je ne sais pas que Dragon ait été prévu pour cet usage (en fait, j'ai toujours lu que cela n'était pas possible, à moins que ce soit inscrit dans le descriptif du produit dans les versions récentes).

On pourrait imaginer que la phase d'apprentissage se fasse sur cet échantillon (résultat non--garanti) mais certainement pas à la première passe.

D'autant que le message d'erreur signale clairement une fréquence d'échantillonnage insuffisante (11 khz) où un minimum de 48 khz devrait être paramétré pour avoir une qualité minimum du fichier.

Je ne sais quel logiciel d'enregistrement vous utilisez et il se peut que vous ne puissiez agir sur ce paramètre, mais si on se réfère à Audacity, on dispose d'une fréquence réglable jusqu'à 128 khz, ce qui se traduit par un son de qualité hifi, comparé à celui correspondant à un très mauvais transistor pour 10 khz.

Incidemment, je dirais que même sans besoin de transcription, l'enregistrement d'un conférencier ne peut $etre correct que s'il accepte de porter un micro-cravate (s'il se déplace) ou au moins que vous placiez ce micro devant un des haut-parleurs de la salle.

En ce qui concerne cette fréquence d'échantillonnage, c'est une des composantes du format de fichier audio. Le format MP3, pratique par son universalité et son faible poids (signal compressé) restitue un son dont la qualité dépend en grande partie de ce paramètre.

Il suffit de faire un enregistrement au format non compressé WAV pour s'en convaincre, mais je ne sais s'il est géré par Dragon et le poids du fichier et donc la place prise sur le support sont incomparablement plus élevés.

En ce qui concerne l'échec de la sélection "mixage stéréo" dont je ne vois pas pourquoi elle serait préférée à un branchement sur l'entrée micro par un cordon mini-jack mâle/mâle en choisissant micro et non mixer, puisque le premier choix s'avère satisfaisant en termes de niveau.

Ceci dit l'échec de ce mixer doit se constater en dehors de Dragon et devrait être réglé préalablement par une recherche au niveau du pilote de la carte son.

Bien entendu, vous êtes libre d'ignorer mes assertions et d'attendre des avis contradictoires, car je n'avance que ma propre expérience.

Cordialement