Python - Classer une chanson d'après ses paroles

Fermé
Lena-tkd - 21 janv. 2021 à 14:21
 Lena-tkd - 21 janv. 2021 à 18:45
Bonjour,

Je suis novice en Python (j'ai vu les bases), et je continue de m'intéresser à ce langage du fait de toutes les possibilités qu'il offre.

Ma "problématique" est la suivante: j'ai créé deux fichiers txt: l'un reprenant les paroles de 9 ou 10 chansons que j'ai arbitrairement qualifié de tristes (et il n'y a pas que du JJGoldman ;), lien: https://www.cjoint.com/c/KAvmZU2ZaW8) et l'autre avec les paroles de 9 ou 10 chansons joyeuses (et il n'y a pas que celles de la compagnie créole ;), lien: https://www.cjoint.com/c/KAvm5CUN7q8)

Et à partir de là, j'aimerais pouvoir déterminer, d'après les paroles d'une nouvelle chanson, si elle est plutôt triste ou plutôt joyeuse sans l'écouter, juste en analysant les mots qu'elle contient.

Auriez-vous une idée ou une piste à me proposer?

Merci!
A voir également:

2 réponses

jee pee Messages postés 40574 Date d'inscription mercredi 2 mai 2007 Statut Modérateur Dernière intervention 20 décembre 2024 9 460
21 janv. 2021 à 14:41
Bonjour,

C'est amusant comme projet ;-) question de base simple, qui débouche sur l'IA.

Tu devrais commencer par un dictionnaire des mots trouvés dans chacune des 2 catégories, et leur nombre d’occurrence par chanson et au total. Ainsi "elle est partie" dans le refrain, qui passe 4 fois, "partie" va valoir +4.

Avec cette première esquisse tu pourras voir si le vocabulaire, les mots utilisés, peut être une piste.

Puis peut être faut-il s'attacher au temps des verbes, passé, présent, futur.
0
yg_be Messages postés 23405 Date d'inscription lundi 9 juin 2008 Statut Contributeur Dernière intervention 20 décembre 2024 Ambassadeur 1 557
21 janv. 2021 à 15:01
bonjour,
à ta place, je commencerais à étudier l'inférence bayésienne.
de ce que j'ai compris,
si tu choisis, par exemple, de travailler sur les mots, individuellement,
en pratique, cela se fait en deux étapes:
(1) analyse de toutes les chansons connues, pour déterminer, pour chaque mot, la probabilité que ce mot soit dans une chanson triste et la probabilité qu'il soit dans une chanson joyeuse
(2) pour une nouvelle chanson, utiliser les probabilités de tous ses mots pour estimer la probabilité qu'elle soit triste et celle qu'elle soit joyeuse.
0
Bonjour,

Et merci à vous deux pour vos retours!
Wow, je ne pensais pas que ce serait si compliqué! Je n'ai jamais entendu parler des notions que vous évoquez, mais ce n'est pas grave, je vais creuser tout ça et vous ferai part de mon avancement, merci encore!!

A bientôt!
0