Mobilités professionnelles de l'Insee (novice)

Question

Bonjour, 

Travaillant avec la mobilité professionnelle de l'Insee, je cherche à faire la somme d'un champ nommé Ipondi seulement sur les trajets commune de résidence à travail, et non pas travail à commune de résidence.

Admettons la colonne de commune de résidence nommée "Départ", et commune de travail nommée "Arrivée", et le champ que je souhaite faire la somme nommée "Ipondi", et admettons le cas suivant :


départ; arrivée; ipondiLa Ciotat; Marseille; 84La Ciotat; Marseille; 15Aubagne; Ceyreste; 12Marseille; La Ciotat; 73


En effectuant la formule suivante ...
select départ, arrivée, sum(ipondi)from trajetsgroup by départ, arrivée

J'obtiens donc le résultat suivant :


La Ciotat; Marseille; 99Aubagne; Ceyreste; 12Marseille; La Ciotat; 73


Ce qui est normal. Je voudrais cependant "supprimer" la ligne Marseille; La Ciotat car c'est le trajet retour des deux premières lignes.
Ceci étant pour arriver à ce résultat :

départ; arrivée; ipondiLa Ciotat; Marseille; 99Aubagne; Ceyreste; 12

Comment faire cela sur PostgreSQL ?

Merci.

jordane45 · Answer

Bonjour,

Avec un Where ?

WHERE depart <> "Marseille" 
 

et si tu veux retirer des départ toutes les éventuelles ville d'arrivée

WHERE depart NOT IN (SELECT DISCTINCT arrivee FROM trajets)


NB: Je n'ai pas mis d'accents... car.. en programmation on evite d'utiliser des caractères accentués et des caractères spéciaux dans le nom des variables, de nom de colonne dans une bdd ou dans le nom des tables.  J'espère que tu n'as pas fait cette bêtise.. grosse source d'erreurs ou de complications en général....

kevin · Answer

Merci pour ta réponse. Effectivement, j'ai n'ai pas pensé à enlever les accents :s très bien de me le faire remarquer ^^

J'ai testé la formule, et elle est vraiment trop radicale ^^ dans mon fichier, je passe de 14500 entités à moins de 4000. De plus j'ai vérifié, et des éléments sont supprimés alors qu'ils ne le devrait pas (des trajets sans retour qui sont supprimés par exemple)

Effectivement, je travaille avec un plus gros fichier, voici un extrait. 

id commune dclt ipondi1 26058 26362 2930,0342912 26235 26235 2556,3137883 26252 26362 13754 26281 26362 1321,7460855 26362 26058 1077,7961736 26057 26057 1040,8849157 26313 26362 898,43106068 26362 26252 859,2863628

Ainsi, la ligne 1 possède son sens inverse avec la ligne 5.
Et la ligne 3 avec la ligne 8.

En lien, mon fichier de données : https://drive.google.com/file/d/1TOB1MTAt8UNCjt0up6qcgnR593yMXkqt/view?usp=sharing

yg_be · Answer

puisque, contrairement à ce que tu avais montré au départ, il y a une colonne id dans la table, tu voudrais peut-être imaginer d'éliminer tous les enregistrements pour lesquels un enregistrement précédent (id plus petit) a l'origine comme destination, et la destination comme origine.
cependant, je ne pense pas qu'il soit possible de faire cela avec une requête.  il faudrait le faire par programme.
et, en réalité, je pense que ce n'est pas une bonne solution.
je pense que la bonne solution serait de différencier les lieux de résidence et les lieux de travail.
ne pourrais pas prendre en compte tous les trajets, et faire la moyenne?

jordane45 · Answer

Bonjour,

Je pense qu'en jouant avec la concaténation des champs depart arrivee  et arrivee depart on devrait pouvoir s'en sortir.

Un truc du genre
 
WHERE CONCAT(arrivee,depart) NOT IN (SELECT CONCAT(depart,arrivee) FROM trajets)

Mobilités professionnelles de l'Insee (novice)

4 réponses

Discussions similaires

Newsletters