Premiers agrégats pour Socio-Fisca
Carte mère : https://git.leximpact.dev/leximpact/gestion-com-strategie/-/issues/54
Voir aussi https://git.leximpact.dev/leximpact/leximpact-prepare-data/-/issues/44 pour les réflexions sur le format.
-
Extraction POTE -
Extraction de la pyramide des ages de https://www.insee.fr/fr/statistiques/fichier/2381472/demo-pop-pyram.xlsx -
Mémo https://documentation-integ.leximpact.dev/leximpact_prepare_data/memo_agregats_POTE/ => Voir https://git.leximpact.dev/leximpact/leximpact-prepare-data/-/issues/63 -
Mise en forme YAML
A changer sur le CASD:
-
Effacer le contenu des notebooks avant export ( make clean-nb
?). -
Ajouter la colonne zn
pour la comparer avecn
. -
Exporter les sommes, moyennes, distributions des variables continues. -
Fusionner les deux exports -
Trouver une autre source sur le handicap que clirpg
: cerfa_field = "R" / "Nombre de titulaires (autres que les enfants) de la carte invalidité d'au moins 80 %" -
Refaire les extractions () de copules avec la nouvelle librairie -
Ajouter f g h i -
Faire la somme de f et h pour avoir le nombre d'enfant par foyer -
Ajouter la variance aux agrégats simples
# Pour assiette de CSG
df["revenus_capitaux_prelevement_bareme"] = df.Z2ch
df["revenus_capitaux_prelevement_liberatoire"] = df.Z2dh
df["revenus_capitaux_prelevement_forfaitaire_unique_ir"] = df.Z2dc + df.Z2tr
df["rente_viagere_titre_onereux_net"] = df.Z1cw + df.Z1dw
# Micro-foncier : on applique l'abattement de 30%
df["revenu_categoriel_foncier"] = (
df.Z4ba + (df.Z4be * 0.7) - (df.Z4bb + df.Z4bc + df.Z4bd)
)
# df['rev_categ_foncier4ba']=df.Z4ba
df["assiette_csg_plus_values"] = df.Z3vg + df.Z3ua + df.Z3vz
df["assiette_csg_revenus_capital"] = (
df["revenus_capitaux_prelevement_bareme"]
+ df["revenus_capitaux_prelevement_liberatoire"]
+ df["revenus_capitaux_prelevement_forfaitaire_unique_ir"]
+ df["rente_viagere_titre_onereux_net"]
+ df["revenu_categoriel_foncier"]
+ df["assiette_csg_plus_values"]
)
# Autres
df["retraites"] = df.Z1as + df.Z1bs + df.MNIMQG
df[
"pre_retraites_etranger"
] = df.Z8sc # Attention, seulement de l'étranger, sinon c'est df.Z1ap + df.Z1bp
df["chomage_et_indemnites"] = df.Z8sw + df.Z8sx + df.Z1ap + df.Z1bp
df["salaire_imposable"] = df.Z1aj + df.Z1bj + df.Z1cj
primes_salaires
+ remuneration_principale
+ primes_fonction_publique
+ indemnite_residence
+ supplement_familial_traitement
+ csg_deductible_salaire
+ cotisations_salariales
- hsup
+ rev_microsocial_declarant1
+ indemnite_fin_contrat
+ complementaire_sante_salarie
+ indemnite_compensatrice_csg
Variables d'intérêts:
Calibration à sortir (10 et 100) : [Z1aj, Z1bj, Z1cj,
Calibration à sortir (1 000) :
Copules à sortir:
Proposition de format: Voir https://git.leximpact.dev/leximpact/leximpact-prepare-data/-/issues/44
PR:
Retours réunion du 10 mars:
- Il faut coller le plus possible au format OpenFisca : à la fois pour les noms de variables et pour l'organisation du fichier. -> Conserver aussi le format d'origine.
- Préparer un format de phrase automatique.
- Séparer les fichiers pour faciliter la lecture et mise à jour par d'autres.
- "agec": "ANNÉE DE NAISSANCE CONJOINT" => Des incohérences, ne pas utiliser.
- "aged": "ANNÉE DE NAISSANCE DÉCLARANT" => Des incohérences, ne pas utiliser.
- "clirpg": "ENFANTS INVALIDES" => Toujours la même valeur.
- "nbpldm": "INDICATEUR MARIé" => N'apporte rien par rapport à "mat"
- "nbfoy": "NB PERSONNES DANS LE FOYER" => Faux, il y en a plein à 0, c'est une autre façon de voir les personnes à charge on dirait. Quand nbpart=1, nbfoy=0
Edited by Benoît Courty