Erreur de code python

Résolu/Fermé

lynajar Messages postés 32 Date d'inscription dimanche 15 décembre 2019 Statut Membre Dernière intervention 9 février 2021 - 18 sept. 2020 à 23:22
yg_be Messages postés 23535 Date d'inscription lundi 9 juin 2008 Statut Contributeur Dernière intervention 27 avril 2025 - 19 sept. 2020 à 17:34

Bonsoir;
je veux calculer le nombre de cluster sur une matrice de similarité,
j'ai utilisé ce code, mais j'ai une erreur d'execution à la ligne 74,
erreur:
TypeError: '(slice(None, None, None), 0)' is an invalid key

# -*- coding: utf-8 -*-
"""
===================================
Demo of DBSCAN clustering algorithm
===================================

Finds core samples of high density and expands clusters from them.

"""
print(__doc__)

import numpy as np
import pandas as pd 
from sklearn.cluster import DBSCAN
from sklearn import metrics
#from sklearn.datasets import make_blobs
from sklearn.preprocessing import StandardScaler

X=pd.read_csv("C:/Users/click/Desktop/doctorat/rfiddd/fichier trouvé resultats/2020-07-22/lev_173.csv", sep=";")
# #############################################################################
# Generate sample data
#centers = [[1, 1], [-1, -1], [1, -1]]
#X, labels_true = make_blobs(n_samples=750, centers=centers, cluster_std=0.4,
                           # random_state=0)



#X = StandardScaler().fit_transform(X)

# #############################################################################
# Compute DBSCAN
db = DBSCAN(eps=15, min_samples=2).fit(X)
core_samples_mask = np.zeros_like(db.labels_, dtype=bool)
core_samples_mask[db.core_sample_indices_] = True
labels = db.labels_

# Number of clusters in labels, ignoring noise if present.
n_clusters_ = len(set(labels)) - (1 if -1 in labels else 0)
print(labels)
n_noise_ = list(labels).count(-1)

print('Estimated number of clusters: %d' % n_clusters_)
print('Estimated number of noise points: %d' % n_noise_)
#print("Homogeneity: %0.3f" % metrics.homogeneity_score(labels_true, labels))
#print("Completeness: %0.3f" % metrics.completeness_score(labels_true, labels))
#print("V-measure: %0.3f" % metrics.v_measure_score(labels_true, labels))
#print("Adjusted Rand Index: %0.3f"
#      % metrics.adjusted_rand_score(labels_true, labels))
#print("Adjusted Mutual Information: %0.3f"
#      % metrics.adjusted_mutual_info_score(labels_true, labels))
#print("Silhouette Coefficient: %0.3f"
#      % metrics.silhouette_score(X, labels))

# #############################################################################
# Plot result
import matplotlib.pyplot as plt

# Black removed and is used for noise instead.
unique_labels = set(labels)
#colors = [plt.cm.Spectral(each)
#          for each in np.linspace(0, 1, len(unique_labels))]

colors=['y','b','g','r']
print (colors)
for k, col in zip(unique_labels, colors):
    if k == -1:
        # Black used for noise.
#        col = [0, 0, 0, 1]
         col='k'

    class_member_mask = (labels == k)

    xy = X[class_member_mask & core_samples_mask]
    plt.plot(xy[:, 0], xy[:, 1], 'o', markerfacecolor=col,
             markeredgecolor='k', markersize=6)

    xy = X[class_member_mask & core_samples_mask]
    plt.plot(xy[:, 0], xy[:, 1], 'o', markerfacecolor=col,
             markeredgecolor='k', markersize=6)

plt.title('Estimated number of clusters: %d' % n_clusters_)
plt.show()

merci d'avance pour toute aide.

A voir également:

Iramuteq erreur r none 1 none none
Sine qua none - Télécharger - Calcul & Conversion
Erreur 0x80070643 - Accueil - Windows
R a l'envers ✓ - Forum Mail
Comment faire les R à l'envers ? - Forum Réseaux sociaux
Erreur 0x80070643 Windows 10 : comment résoudre le problème de la mise à jour KB5001716 - Accueil - Windows

8 réponses

Réponse 1 / 8

yg_be Messages postés 23535 Date d'inscription lundi 9 juin 2008 Statut Contributeur Dernière intervention 27 avril 2025 Ambassadeur 1 579
19 sept. 2020 à 11:27

bonjour,
as-tu comparé le contenu de X par rapport au contenu du programme non modifié?

Réponse 2 / 8

lynajar Messages postés 32 Date d'inscription dimanche 15 décembre 2019 Statut Membre Dernière intervention 9 février 2021
19 sept. 2020 à 11:59

Bonjour;
marci yg_be pour ton aide,

le contenu de X est:
[[ 0.49426097 1.45106697]
[-1.42808099 -0.83706377]
[ 0.33855918 1.03875871]
...
[-0.05713876 -0.90926105]
[-1.16939407 0.03959692]
[ 0.26322951 -0.92649949]]

et le contenu de ma base est une matrice de similarité symétrique de taille (173*173)
voici un exemple:
1 0.30 0.28 0.25 0.36
0.30 1 0.39 0.34 0.23
0.28 0.39 1 0.39 0.28
0.25 0.34 0.39 1 0.33
0.36 0.23 0.28 0.33 1

comment procéder pour appliquer mes données sur cet exemple de code,

merci

yg_be Messages postés 23535 Date d'inscription lundi 9 juin 2008 Statut Contributeur Dernière intervention 27 avril 2025 1 579
19 sept. 2020 à 12:13

peux-tu partager ton fichier csv?

Réponse 3 / 8

lynajar Messages postés 32 Date d'inscription dimanche 15 décembre 2019 Statut Membre Dernière intervention 9 février 2021
19 sept. 2020 à 12:19

voici le lien du fichier
https://www.cjoint.com/c/JItkswlIksa

yg_be Messages postés 23535 Date d'inscription lundi 9 juin 2008 Statut Contributeur Dernière intervention 27 avril 2025 1 579
19 sept. 2020 à 13:02

pourquoi la ligne 28 est-elle commentée?

Réponse 4 / 8

lynajar Messages postés 32 Date d'inscription dimanche 15 décembre 2019 Statut Membre Dernière intervention 9 février 2021
19 sept. 2020 à 13:06

normalement d’après mon fichier elle est pas commenté!!!

yg_be Messages postés 23535 Date d'inscription lundi 9 juin 2008 Statut Contributeur Dernière intervention 27 avril 2025 1 579
19 sept. 2020 à 13:17

regarde le code que tu as partagé.

Réponse 5 / 8

lynajar Messages postés 32 Date d'inscription dimanche 15 décembre 2019 Statut Membre Dernière intervention 9 février 2021
19 sept. 2020 à 13:21

oui c'est vrai dans le code que j'ai partagé la ligne 28 est commenté,
comme le programme ne voulais pas s'executer, alors j'ai mis cette ligne en commentaire, pour voire si l'erreur vien de cette ligne

yg_be Messages postés 23535 Date d'inscription lundi 9 juin 2008 Statut Contributeur Dernière intervention 27 avril 2025 1 579
19 sept. 2020 à 13:30

as-tu essayé de rétablir cette ligne?

yg_be Messages postés 23535 Date d'inscription lundi 9 juin 2008 Statut Contributeur Dernière intervention 27 avril 2025 1 579 > yg_be Messages postés 23535 Date d'inscription lundi 9 juin 2008 Statut Contributeur Dernière intervention 27 avril 2025
19 sept. 2020 à 16:59

as-tu essayé de rétablir cette ligne?

Réponse 6 / 8

lynajar Messages postés 32 Date d'inscription dimanche 15 décembre 2019 Statut Membre Dernière intervention 9 février 2021
Modifié le 19 sept. 2020 à 13:29

an recherchant sur internet, j'ai fait cette modification concernant l'importation du fichier csv,
la première erreur ne s'affiche plus, mais maintenant j'ai une autre erreur à la ligne 32:
ValueError: could not convert string to float: '0.307692307692308;1;0.392857142857143;

voici le code avec modification à partir de la ligne 21 jusqu'a la ligne 23

import numpy as np
import pandas as pd 
from sklearn.cluster import DBSCAN
from sklearn import metrics
from sklearn.datasets import make_blobs
from sklearn.preprocessing import StandardScaler
from pandas import read_csv

#rcParams['figure.figsize'] = 70, 40
csv_url = 'C:/Users/click/Desktop/doctorat/rfiddd/fichier trouvé resultats/2020-07-22/bisim_173.csv'
df = pd.read_csv(csv_url)
df.iloc[:, 0:172].values 
#X=pd.read_csv("C:/Users/click/Desktop/doctorat/rfiddd/fichier trouvé resultats/2020-07-22/bisim_173.csv", sep=";")
# #############################################################################
# Generate sample data
#centers = [[1, 1], [-1, -1], [1, -1]]
#X, labels_true = make_blobs(n_samples=750, centers=centers, cluster_std=0.4,
                           # random_state=0)


df = StandardScaler().fit_transform(df)

# #############################################################################
# Compute DBSCAN
db = DBSCAN(eps=50, min_samples=3).fit(df)
core_samples_mask = np.zeros_like(db.labels_, dtype=bool)
core_samples_mask[db.core_sample_indices_] = True
labels = db.labels_

# Number of clusters in labels, ignoring noise if present.
n_clusters_ = len(set(labels)) - (1 if -1 in labels else 0)
print(labels)
n_noise_ = list(labels).count(-1)

print('Estimated number of clusters: %d' % n_clusters_)
print('Estimated number of noise points: %d' % n_noise_)
#print("Homogeneity: %0.3f" % metrics.homogeneity_score(labels_true, labels))
#print("Completeness: %0.3f" % metrics.completeness_score(labels_true, labels))
#print("V-measure: %0.3f" % metrics.v_measure_score(labels_true, labels))
#print("Adjusted Rand Index: %0.3f"
#      % metrics.adjusted_rand_score(labels_true, labels))
#print("Adjusted Mutual Information: %0.3f"
#      % metrics.adjusted_mutual_info_score(labels_true, labels))
#print("Silhouette Coefficient: %0.3f"
#      % metrics.silhouette_score(X, labels))

# #############################################################################
# Plot result
import matplotlib.pyplot as plt

# Black removed and is used for noise instead.
unique_labels = set(labels)
#colors = [plt.cm.Spectral(each)
#          for each in np.linspace(0, 1, len(unique_labels))]

colors=['y','b','g','r']
print (colors)
for k, col in zip(unique_labels, colors):
    if k == -1:
        # Black used for noise.
#        col = [0, 0, 0, 1]
         col='k'

    class_member_mask = (labels == k)

    xy = df[class_member_mask & core_samples_mask]
    plt.plot(xy[:, 0], xy[:, 1], 'o', markerfacecolor=col,
             markeredgecolor='k', markersize=6)

    xy = df[class_member_mask & core_samples_mask]
    plt.plot(xy[:, 0], xy[:, 1], 'o', markerfacecolor=col,
             markeredgecolor='k', markersize=6)

plt.title('Estimated number of clusters: %d' % n_clusters_)
plt.show()

yg_be Messages postés 23535 Date d'inscription lundi 9 juin 2008 Statut Contributeur Dernière intervention 27 avril 2025 1 579
19 sept. 2020 à 14:41

comprends-tu ce que tu as changé?

Réponse 7 / 8

lynajar Messages postés 32 Date d'inscription dimanche 15 décembre 2019 Statut Membre Dernière intervention 9 février 2021
19 sept. 2020 à 15:46

iloc est utilisée pour l'indexation basée sur des emplacements entiers, elle permet de sélectionner les colonnes, en utilisant une notation de découpage.

mon but c'est l'utilisation de la méthode dbscan pour regrouper mon fichier csv en classes,
pour cela j'ai essayer plusieurs solutions mais ça na pas marché,

désolé pour les fautes de programmation, parce que je débute avec le langage python

yg_be Messages postés 23535 Date d'inscription lundi 9 juin 2008 Statut Contributeur Dernière intervention 27 avril 2025 1 579
19 sept. 2020 à 16:59

si t fais un changement que tu ne comprends pas et qui provoque une erreur, pourquoi ne pas faire marche arrière?

Réponse 8 / 8

lynajar Messages postés 32 Date d'inscription dimanche 15 décembre 2019 Statut Membre Dernière intervention 9 février 2021
19 sept. 2020 à 17:28

j'ai fait un marche arrière comme tu me la demandé "yg_be" et ça marche,et j'ai supprimer le commentaire de la ligne 28.
merci beaucoup pour ton aide

yg_be Messages postés 23535 Date d'inscription lundi 9 juin 2008 Statut Contributeur Dernière intervention 27 avril 2025 1 579
19 sept. 2020 à 17:34

peux-tu alors marquer la discussion comme résolue?

Discussions similaires

typeError: tuple indices must be integers, not str

erreur : list indices must be integers or slices, not NoneType

IRaMuTeQ - Erreur R

lire les vidéos de Mycanal avec navigateur Firefox

text-decoration ne fonctionne pas

outlook