Combinaison linéaire et régression sous excel

Fermé
nosferno - 16 févr. 2012 à 11:58
JvDo Messages postés 1978 Date d'inscription mercredi 27 juillet 2005 Statut Membre Dernière intervention 28 septembre 2020 - 17 févr. 2012 à 16:07
Bonjour,

Pour des travaux de recherche, j'aimerai être capable de combiner dans une ou plusieurs macros une combinaison linéaire et une régression linéaire.
Comme un exemple vaut mieux que de longs discours:

Pour l'instant j'ai un tableau excel qui se présente sous la forme suivante:

date t y x1 x2 .... x380
t-1 .... ... ... ....
t-2
...

Ce que je voudrais c'est qu'une macro me donne toutes les combinaisons de 4 déterminants différents (l'ordre n'a évidemment pas d'importance) puis que pour chacune des combinaisons générées, une regression linéaire soit appliquée (avec une constante nulle).

Idéalement, je ne voudrais avoir les résultats qu'avec un R²>0.8 et bien entendu les coefficient des déterminants de ces résultats.

Voilà dejà quelques temps que je me creuse la tête et que je parcours les forums pour trouver des éléments de réponse mais sans succès...

Si quelqu'un pense avoir des éléments de réponses, qu'il n'hésite pas à les partager...

D'avance merci


A voir également:

1 réponse

JvDo Messages postés 1978 Date d'inscription mercredi 27 juillet 2005 Statut Membre Dernière intervention 28 septembre 2020 856
17 févr. 2012 à 00:45
Bonsoir,

D'où sortent tes déterminants? c'est toi qui les fixes?
Ton y est une fonction de 380 variables?

Je vois une matrice 381 colonnes sur p lignes.
S'il faut ,ne serait-ce que calculer les déterminants d'ordre 380 (en supposant p>=381), il y en aura autant que de mineur de chaque élément de la matrice soit : 145 161 !!

Donc j'imagine que tu ne cherches pas à faire des combinaisons linéaires de 4 déterminants au hasard.

Racontes-en plus.

Cordialement
0
En fait, pour tout te dire, il s'agit d'un travail en finance.

Mon y représente un fond d'investissement et mes x sont les différents indices disponibles.

Ce que je voudrais faire c'est déterminer le meilleur benchmark et pour cela, j'aurais voulu essayer toutes les combinaisons de 4 indices parmi les 380 dont je dispose.
Et comme, la plupart des régressions de ces combinaisons auront surment un R² très faibles, je n'aurais besoin que des régressions les plus pertinentes (R²>0.8).

Suis-je assez clair? N'hésite pas si tu as besoin de plus d'info...
0
JvDo Messages postés 1978 Date d'inscription mercredi 27 juillet 2005 Statut Membre Dernière intervention 28 septembre 2020 856
17 févr. 2012 à 15:25
As-tu identifié les indices les plus fortement corrélés?
Je suppose en plus que cette corrélation dépend des actifs du fond et de leurs durées de détention.
Tu pourrais identifier déjà les indices en rapport avec le panier de valeurs du fond.
Ca permettrait de réduire les 855 millions de combinaisons de 4 parmi 380.

Ensuite, au sujet des combinaisons linéaires de 4 indices : tu veux trouver une sorte d'indice moyen pondéré? Avec un pas de 1/10 ? à vue de nez, 80 possibilités par choix de 4 indices.

Il est possible de faire des traitements sur des sous ensembles choisis soit manuellement, soit aléatoirement.

Reste à voir ce que tu veux comme calculs ensuite et ça reste jouable sur ces échantillons réduits.

Si tu peux monter un fichier de données (via Cjoint) avec les calculs que tu souhaites, je pense qu'il y a du monde ici qui pourra t'aider à automatiser.

Cordialement
0
Le but est justement d'éviter de devoir analyser chaque indice, chaque fond et leur correlation(car évidemment le but est de pouvoir l'appliquer cette macro à plusieurs fonds ayant chacun des particularités propres).

Que veux-tu dire "avec un pas de 1/10"?

Tu as bien compris le but: recomposer les performances passées d'un fond en combinant 4 indices distincts.

Petite correction qui ne change pas grand chose si ce n'est le nombre de possibilités: je n'ai pas 380 indices mais bien plus de 600...

Malheureusement je ne peux te transmettre mes données mais ce que je peux te dire c'est que je ne travaille pas avec les données bruts mais avec des différentiels logarithmiques afin d'éviter tout biais et que seuls les R² et les coefficients m'intéressent.

Cordialement
0
JvDo Messages postés 1978 Date d'inscription mercredi 27 juillet 2005 Statut Membre Dernière intervention 28 septembre 2020 856
17 févr. 2012 à 16:07
L'important n'est pas d'avoir tes vraies données mais un support de données quelconques (30 indices par exemple) sur le nombre de lignes qui convient.
Ensuite tu donnes un exemple du calcul attendu en prenant un groupe de 4 parmi les 30 et la méthode de calcul de ton critère de filtrage sur R².
Autrement dit, je n'ai pas envie de faire quelque chose avec des formules fausses issues de souvenirs lointains.

Pour ce qui est du pas de 1/10, il s'agit de l'incrément de variation des pondérations d'indices.
Sauf si tu as des pas d'incrémentation "optimisés", c'est une possibilité pour tester sur un ensemble discret de poids.
Parfois, en analyse numérique, on optimise un procédé en prenant les racines de polynômes. Je ne sais pas si c'est le cas dans ce qui t'intéresse. (apriori, je ne crois pas)

Cordialement
0