kabrice01
Messages postés1180Date d'inscriptiondimanche 21 décembre 2008StatutMembreDernière intervention12 avril 2021
-
2 juin 2015 à 04:57
Bonjour,
J'étudie aujourd'hui la reconnaissance / synthèse vocale, et dans le but
d'établir un logiciel performant et propre à mes besoins, je cherche
une API efficace.
Le cahier des charges est le suivant :
- l'API doit supporter la reconnaissance vocale du français et l'anglais en fonction des réglages (si possible d'autres langues)
- elle devra traiter correctement le bruit de fond et les accents de
prononciation
- elle doit minimiser le temps d'apprentissage de l'user (temps pour
lequel elle s'approprie les caractéristiques de sa voix : ton,
vitesse, volume, accent )
-En faites, je voudrai une API Multi-langue, qui quand je parle (en Anglais ou en Français en fonction du réglage) puisse exécuter certaines tâches que j'aurai prédéfinies.
Quelques Speech API sont disponibles, comme :
JSAPI (Java Speech API)
Cloudgarden
l'api de Google...
Mon problème est le suivant : j'ai trouvé pas mal de caractéristiques
sur ces API, la seule chose qui me manque, ce sont des points de vue,
des avis.
Quelqu'un a-t-il déja rencontré et mis en oeuvre ces API ? Qu'en
pensez-vous ? Lesquelles se valent ?
Ont-elles de bons taux de reconnaissance ? Une marge d'erreur
signifiante ? Un défaut particulier ?
Existe t-il d'autres API non citées ? ça m'intéresse.