Base de donnée ou fichier de donnée ?

Fermé
gaston38 - Modifié par gaston38 le 7/05/2014 à 12:42
 gaston38 - 14 mai 2014 à 12:36
Bonjour,

je vais tenté de vous expliquer mon "dilemme".

J'ai prévu de récupérer un quantité importante de données dans un but d'étude statistiques.
Je pense faire mes études via excel ou tout logiciel similaire permettant notamment la création de graph....
Est-il à votre avis préférable, lors de la récupération de ces données, de les stocker en BDD et de générer un excel depuis les données qui m'intéressent (donc de faire la sélection avant l'ouverture dans le logiciel choisi) ou de récupérer mes données directement dans un énorme fichier json ou xml (que je mettrai à jour au fur et à mesure) qu'il me suffirait d'ouvrir ensuite directement en excel ? Je tiens à préciser que je n'ai aucun problème avec la programmation. Mon problème viens plus du fait de savoir comment traiter cette importante masse de données.

Suis-je assez clair dans ma demande ? J'avoue que c'est pas facile à expliquer.

Je suis bien sûr preneur de toutes remarques, idées ...

Merci d'avance
A voir également:

5 réponses

benol3 Messages postés 569 Date d'inscription lundi 29 juillet 2013 Statut Membre Dernière intervention 7 mai 2015 87
7 mai 2014 à 12:45
Salut,

Je penser que stocker tes données dans une base de données et d'extraire les données qui te sont nécessaires en vue de réaliser un traitement statistique à l'aide de requêtes SQl et beaucoup plus simple et surtout rapide que d'avoir un fichier lourd avec toutes tes données dedans.
0
Je dois avouer que je pensais un peu comme toi mais comme je prévois d'utiliser scrapy et que celui-ci permet l'export en json, csv ou xml, je me disais que plutot que de traiter toutes mes données pour les enregistrer en BDD (+ création de la bDD, de sa structure, des différentes tables....)

Je pensais gagner un peu de temps mais c'est sur que si c'est pour en perdre au final a chaque utilisation
0
Je me permets de revenir vers vous car après réflexion, j'arrive pas à me décider sur le choix d'une BDD (SQL ou noSQL). Je vais essayer de vous expliquer plus en détails.

Concernant les données à traiter, je récupère un json ou un csv (scrappy permet d'exporter les 2 formats). Il va s'agir de données sportives. Pour donner un exemple, un club de foot avec des joueurs, un entraineur, un stade, des matchs, des données météo suivant le match, le résultat....

Le but de tout ça est de faire des études de stats pour un match à venir. Comparaison des équipes suivant la météo, le stade (domicile ou extérieur), l'entraineur qui a changé, les performances sur les derniers matchs , la date dans la saison... Je peux avoir aussi envie de voir tout ce qu'a fait un entraineur (tous ces matchs tout club confondus), idem pour un joueur, pour un type de temps donnée...

Globalement, je vais avoir bcp de données, toutes structurées de la même manière (quasiment :??: ), que j'ai besoin d'écrire une seule fois mais de lire plusieurs fois (extraction vers mon excel).

Je tiens à préciser que je suis dans la vie développeur php/mysql/css. J'ai donc des connaissances en SQL mais aucune en NoSQL.

Qu'est ce qui d'après-vous serait le plus logique ? Apprendre le NoSQL car je risque d'avoir rapidement bcp de données ? Passer du temps à structurer mes tables parfaitement et parser mes json ou csv avant insertion. Insérer le json directement dans une table NoSQL orientée documents ? orientée graphe ?....

Merci à tous pour vos pistes de réflexion

ps : si vous pensez que ce serait mieux que j'ouvre un autre topic, n'hésitez pas.
0
benol3 Messages postés 569 Date d'inscription lundi 29 juillet 2013 Statut Membre Dernière intervention 7 mai 2015 87
14 mai 2014 à 12:28
Alors là, je ne peux pas te renseigner, cela dépasse mes connaissances :)
Je connais pas du tout le NoSQL.

Il est vrai que tu va posséder un nombre très très important de données et qu'une BDD relationnelle va vite être mise à rude épreuve en accumulant beauocup de données. Donc le NoSQL parait plus approprié...

Peut être que d'autres personnes de la communauté CCM pourront plus t'éclairer que moi...

Sinon je te conseille de poser cette question sur Developpez.net qui possède un forum dédié au NoSQL :
https://www.developpez.net/forums/f1743/bases-donnees/nosql/


En tout cas je trouve ton projet très intéréssant.
Tiens nous au courant de l'avancement de ton projet.

Et bon courage pour la suite :)
0

Vous n’avez pas trouvé la réponse que vous recherchez ?

Posez votre question
J'avais déjà posé mon problème sur developpez.net mais dans le forum algo.

Merci pour ton soutien et tes réponses, ça fait plaisir :)

A bientôt peut-être
0