[Pipeline] Refaire l'injection par type de revenu principal
OBJECTIFS
-> Faire une injection par types de revenus.
Il faudrait:
-
Découper les bases ERFS et POTE en 5 sous-bases selon que les foyers n’aient :
- que du salaire (sous-bases ERFS1 et POTE1)
- que du chômage (sous-bases ERFS2 et POTE2)
- que de la retraite
- que du revenu du capital
- un mélange des 4
ATTENTION ! On filtre par catégorie de revenu (et pas par montant) On a un découpage tel que:
ERFS == ERFS1 + ERFS2 + ERFS3 + ERFS4 + ERFS5
POTE == POTE1 + POTE2 + POTE3 + POTE4 + POTE5
-
Génerer les copules associés aux 5 bases POTE -
Faire l’injection pour chaque sous-base (ERFS1 <-> Copules_POTE1, ERFS2 <-> Copules_POTE2, ... ) -
Regrouper les 5 bases ERFS avec leurs nouvelles variables en une base unique -
Eventuellement, ajouter des gens dans certaines categories de revenus pour ameliorer le tirage
EXPLICATIONS
Aujourd’hui on ajoute plusieurs variables (Var1, Var2,...) en créant des fonctions f1 (les copules) qui lient ces variables à une variable de référence (le RFR), c'est-à-dire:
--> Var1 = f1 (RFR), Var2 = f2 (RFR), Var3 = f3 (RFR)
Idealement on voudrait relier les nouvelles variables à partir de plusieurs variables de référence : Var1 = f1 (RFR, Salaire, Retraité, Chomeur, Age, Situation maritale) mais c’est trop complexe, car même si on peut probablement faire des copules en X dimensions, on se confrontera à 2 problèmes techniques:
1- Le temps d'extraction
2- le secret statistique
Du coup on fait le découpage ci-dessus, avec des nouveaux copules: f1_2 serait le copule entre la Var1, le RFR et les gens qui sont uniquement Chômeurs
--> Var1_1 = f1_1 (RFR, Salaire) , Var1_2 = f1_2 (RFR, Chomage)