Programmation d’une reconnaissance vocale en python
Fermé
HugoM_0601
Messages postés
4
Date d'inscription
vendredi 9 septembre 2022
Statut
Membre
Dernière intervention
19 septembre 2022
-
19 sept. 2022 à 22:58
mamiemando Messages postés 33079 Date d'inscription jeudi 12 mai 2005 Statut Modérateur Dernière intervention 23 avril 2024 - 22 sept. 2022 à 11:28
mamiemando Messages postés 33079 Date d'inscription jeudi 12 mai 2005 Statut Modérateur Dernière intervention 23 avril 2024 - 22 sept. 2022 à 11:28
A voir également:
- Python reconnaissance vocale
- Reconnaissance facial photo - Guide
- Discussion vocale whatsapp - Guide
- Reconnaissance musique en ligne - Guide
- Logiciel reconnaissance facial - Télécharger - Photo & Graphisme
- Citizen code python - Guide
1 réponse
mamiemando
Messages postés
33079
Date d'inscription
jeudi 12 mai 2005
Statut
Modérateur
Dernière intervention
23 avril 2024
7 749
Modifié le 22 sept. 2022 à 11:30
Modifié le 22 sept. 2022 à 11:30
Bonjour,
Ça me paraît compliqué, car il n'y a pas de programme sur étagère qui connaît le nom des personnes qui pourraient être amenées à parler à ton programme. Ce qui veut dire que tu dois pouvoir caractériser la voix de quelqu'un et associer à ces caractéristiques le nom de la personne.
Cela nécessite donc un algorithme de machine learning.
Voici un état de l'art préliminaire (trouvé en cherchant "speaker recognition python") :
- https://github.com/orchidas/Speaker-Recognition (codé avec scipy)
- Identifying speakers with voice recognition (avec un LSTM, codé avec keras)
- Speaker Recognition (avec un CNN, codé avec keras)
- Speaker Identification Using Machine Learning (avec un Gaussian mixture model, codé en sklearn)
Je n'ai aucune idée de ce qui donnera le meilleur résultat, donc peut-être qu'il faut simplement tester pour se faire une idée, mais le premier semble intéressant.
Bonne chance