Programmation d’une reconnaissance vocale en python
Fermé
HugoM_0601
Messages postés
4
Date d'inscription
vendredi 9 septembre 2022
Statut
Membre
Dernière intervention
19 septembre 2022
-
19 sept. 2022 à 22:58
mamiemando Messages postés 33650 Date d'inscription jeudi 12 mai 2005 Statut Modérateur Dernière intervention 30 avril 2025 - 22 sept. 2022 à 11:28
mamiemando Messages postés 33650 Date d'inscription jeudi 12 mai 2005 Statut Modérateur Dernière intervention 30 avril 2025 - 22 sept. 2022 à 11:28
A voir également:
- Python reconnaissance vocale
- Discussion vocale whatsapp - Accueil - Messagerie instantanée
- Reconnaissance musique en ligne sans télécharger - Guide
- Citizen code python avis - Accueil - Outils
- Dictée vocale mac - Guide
- Gboard saisie vocale - Accueil - Applications & Logiciels
1 réponse
mamiemando
Messages postés
33650
Date d'inscription
jeudi 12 mai 2005
Statut
Modérateur
Dernière intervention
30 avril 2025
7 846
Modifié le 22 sept. 2022 à 11:30
Modifié le 22 sept. 2022 à 11:30
Bonjour,
Ça me paraît compliqué, car il n'y a pas de programme sur étagère qui connaît le nom des personnes qui pourraient être amenées à parler à ton programme. Ce qui veut dire que tu dois pouvoir caractériser la voix de quelqu'un et associer à ces caractéristiques le nom de la personne.
Cela nécessite donc un algorithme de machine learning.
Voici un état de l'art préliminaire (trouvé en cherchant "speaker recognition python") :
- https://github.com/orchidas/Speaker-Recognition (codé avec scipy)
- Identifying speakers with voice recognition (avec un LSTM, codé avec keras)
- Speaker Recognition (avec un CNN, codé avec keras)
- Speaker Identification Using Machine Learning (avec un Gaussian mixture model, codé en sklearn)
Je n'ai aucune idée de ce qui donnera le meilleur résultat, donc peut-être qu'il faut simplement tester pour se faire une idée, mais le premier semble intéressant.
Bonne chance