Python - Classer une chanson d'après ses paroles

Lena-tkd -  
 Lena-tkd -
Bonjour,

Je suis novice en Python (j'ai vu les bases), et je continue de m'intéresser à ce langage du fait de toutes les possibilités qu'il offre.

Ma "problématique" est la suivante: j'ai créé deux fichiers txt: l'un reprenant les paroles de 9 ou 10 chansons que j'ai arbitrairement qualifié de tristes (et il n'y a pas que du JJGoldman ;), lien: https://www.cjoint.com/c/KAvmZU2ZaW8) et l'autre avec les paroles de 9 ou 10 chansons joyeuses (et il n'y a pas que celles de la compagnie créole ;), lien: https://www.cjoint.com/c/KAvm5CUN7q8)

Et à partir de là, j'aimerais pouvoir déterminer, d'après les paroles d'une nouvelle chanson, si elle est plutôt triste ou plutôt joyeuse sans l'écouter, juste en analysant les mots qu'elle contient.

Auriez-vous une idée ou une piste à me proposer?

Merci!
A voir également:

2 réponses

jee pee Messages postés 41520 Date d'inscription   Statut Modérateur Dernière intervention   9 720
 
Bonjour,

C'est amusant comme projet ;-) question de base simple, qui débouche sur l'IA.

Tu devrais commencer par un dictionnaire des mots trouvés dans chacune des 2 catégories, et leur nombre d’occurrence par chanson et au total. Ainsi "elle est partie" dans le refrain, qui passe 4 fois, "partie" va valoir +4.

Avec cette première esquisse tu pourras voir si le vocabulaire, les mots utilisés, peut être une piste.

Puis peut être faut-il s'attacher au temps des verbes, passé, présent, futur.
0
yg_be Messages postés 23541 Date d'inscription   Statut Contributeur Dernière intervention   Ambassadeur 1 584
 
bonjour,
à ta place, je commencerais à étudier l'inférence bayésienne.
de ce que j'ai compris,
si tu choisis, par exemple, de travailler sur les mots, individuellement,
en pratique, cela se fait en deux étapes:
(1) analyse de toutes les chansons connues, pour déterminer, pour chaque mot, la probabilité que ce mot soit dans une chanson triste et la probabilité qu'il soit dans une chanson joyeuse
(2) pour une nouvelle chanson, utiliser les probabilités de tous ses mots pour estimer la probabilité qu'elle soit triste et celle qu'elle soit joyeuse.
0
Lena-tkd
 
Bonjour,

Et merci à vous deux pour vos retours!
Wow, je ne pensais pas que ce serait si compliqué! Je n'ai jamais entendu parler des notions que vous évoquez, mais ce n'est pas grave, je vais creuser tout ça et vous ferai part de mon avancement, merci encore!!

A bientôt!
0