r代写-M1 MBFA|学霸联盟

r代写-M1 MBFA

时间：2021-12-17

Microéconométrie M1 MBFA Projet 4 Groupe 5
Généralités
Le but de ce projet est de vous faire manipuler les estimateurs de panel et les outils associés. Un
premier volet consiste en une série de simulations de Monte Carlo afin de comprendre le comportement
des estimateurs en fonction des caractéristiques des effets individuels inobservés. Un second volet vous fera
manipuler des données réelles, construire un modèle, l’estimer selon plusieurs méthodes, puis interpréter
les résultats.
Comme d’habitude vous aurez besoin d’un certain nombre de paquets, dont MASS, ggplot2, tidyr,
dplyr, plm, MonteCarlo et éventuellement stargazer si vous voulez un affichage plus esthétique des
résultats.
1 Premier volet : Monte Carlo
Le but de ce premier volet est d’étudier les propriétés des est des MCO empilés (pooled), du modèle à
effets fixes et du modèle à effets aléatoires en fonction des caractéristiques de l’hétérogénéité individuelle
inobservée.
1.1 Première étape
On génère une base de données de panel ayant n = 100 individus observés sur T = 10 périodes, pour
un total de 1000 observations.
Téléchargez le fichier tirages_projet4.R disponible sur Moodle dans la section sur le projet 4. Il
contient du code permettant de générer la base décrite ci-dessus. Cette dernière contient un effet individuel
alpha (normalement non observé), une variable explicative x et une variable à expliquer y telle que
yit = 1 + xit + αi + it
Ele contient également les identifiants individuels (id) et de période (period). Le data.frame qui est
produit est nommé base
1. Déclarez les données comme étant des données de panel avec la commande pdata.frame issu du
paquet plm
2. Effectuez la régression de y sur x à l’aide du modèle MCO emplilé (pooled) , du modèle à effets
fixes puis du modèle à effets aléatoires. 1. À chaque fois, extrayez le coefficient estimé βˆx associé à
la variable x.
1.2 Seconde étape
On veut maintenant créer une fonction à partir du code qui précède, et effectuer des simulations de
Monte Carlo.
Remarquez que le code que vous avez téléchargé fait appel à deux paramètres : cov et varu. Ces deux
paramètres seront les arguments de votre fonction ; et ne doivent donc plus se voir assigner de valeurs au
sein de la fonction. varu correspond à la variance du terme d’hétérogénéité individuelle alpha ; et cov la
covariance entre alpha et x. La fonction doit retourner les valeurs des βˆx des trois méthodes d’estimation.
1. On effectue une première série de simulations de Monte Carlo en fixant varu= 1, et en faisant
prendre à cov les valeurs -0.75 ; 0 ; et 0.75. 2
— Créez un tableau donnant les moyennes et écart-types des βˆx pour chaque valeur de cov
1. Utilisez les outils de plm pour ces estimateurs de panel, ne le faites pas à la main
2. Pour fixer la valeur d’un paramètre lors des simulations, il suffit de ne lister que la valeur souhaitée dans la liste qu’on
passe à param_list
— Faites un graphique traçant les distributions des βˆx pour chaque valeur de cov
NB : Pour les deux questions précédentes, il est plus efficace de passer par la commande pivot_longer
du paquet tidyr. Supposons que df soit la data.frame issue de MakeFrame après la simulation
Monte Carlo. Supposons encore que les βˆx soient nommés mco, fixed et random. Vous pouvez
alors lancer les commandes :
base_gr<-pivot_longer(df,cols=c("mco","fixed","random"),names_to="estimateur",values_to="beta")
base_gr %>% group_by(cov,estimateur) %>% summarise("moy"=mean(beta),"ecty"=sd(beta))
ggplot(base_gr) + geom_density(aes(x=beta,color=estimateur)) + facet_wrap(~cov)
— Concluez sur le choix du meilleur estimateur dans chaque cas
— Dans le cas où cov= 0, lequel des trois estimateur vous semble préférable ? Pourquoi ?
2. On effectue une deuxième série de simulation (en se basant sur la même fonction que ci-dessus,
inutile de la changer) en fixant cov= 0 et en faisant prendre à varu les valeurs 0.01, 1 et 4.
— Créez un tableau donnant les moyennes et écart-types des βˆx pour chaque valeur de varu
— Faites un graphique traçant les distributions des βˆx pour chaque valeur de varu
NB : vous avez juste à adapter les commandes proposés ci-dessus.
— Vers quoi tend la distribution de l’estimateur à effets aléatoire lorsque varu tend vers 0 ? Et
lorsqu’il grandit ? Reliez vos résultats avec les éléments théoriques vu en cours.
2 Second volet
Pour le second volet de ce projet, vous devrez utiliser des données réelles, estimer un certain nombre
de modèles, les interpréter et sélectionner le plus pertinent.
Commencez par charger la paquet readr et télécharger la base avec
ma_base <- read_csv("https://raw.githubusercontent.com/ATerracol/P8Econ/master/data/Projet4_Groupe5.csv")
Cette base contient des données sur 32 états américains (sélectionnés aléatoirement pour chaque groupe
parmi les 48 « lower states » de la base originelle). Elle contient les variables suivantes :
— state l’état
— year l’année
— region la région
— pcap la stock de capital public
— hwy la composante "autoroutes et routes" du capital public
— water la composante "eau et égouts" du capital public
— util la composante "autres bâtiments" du capital public
— pc le stock de capital privé
— gsp le "PNB" de l’état
— emp la quantité de travail
— unemp le taux de chômage de l’état
On cherche à estimer une fonction de production à la Cobb-Douglass (cf slides de L3) en régressant
le log du PNB de l’état sur le log de son stock de capital privé, le log de la quantité de travail, et le taux
de chômage. On se demande ensuite si le stock de capital public, ou ses composantes, a également une
influence sur la production d’un état.
1. Produisez un graphique reliant le log du capital privé et le log de la production de l’état, sur le
modèle du graphique suivant (la liste des états sera différente)
910
11
12
13
9 10 11 12 13
log(pc)
lo
g(g
sp
)
state
ALABAMA
ARIZONA
CALIFORNIA
COLORADO
CONNECTICUT
FLORIDA
GEORGIA
ILLINOIS
KANSAS
KENTUCKY
LOUISIANA
MARYLAND
MASSACHUSETTS
MICHIGAN
MISSOURI
MONTANA
NEBRASKA
NEVADA
NEW_HAMPSHIRE
NEW_JERSEY
NEW_MEXICO
NEW_YORK
NORTH_DAKOTA
OKLAHOMA
PENNSYLVANIA
SOUTH_DAKOTA
TENNESSE
TEXAS
VERMONT
WASHINGTON
WISCONSIN
WYOMING
2. Faites de même en utilisant le log de la variable "autoroutes et routes" au lieu du log du capital
privé.
3. En comparant les deux graphiques, dites si vous pensez qu’un modèle à effet aléatoire sera approprié
si on introduit le log de la variable "autoroutes et routes" dans le modèle.
4. Pour chacune des trois spécifications suivantes, estimez le modèle par effets fixes et par effets
aléatoires. Faites un test d’Hausman pour décider lequel est le plus approprié.
(a) log(pnb) en fonction de log(capital privé), log(emploi) et chômage (en niveau)
(b) log(pnb) en fonction de log(capital privé), log(emploi), log(capital public) et chômage (en ni-
veau)
(c) log(pnb) en fonction de log(capital privé), log(emploi), log de chaque composante du capital
public et chômage (en niveau)
Spécification 1
5. En étudiant les résultats des trois spécifications ci-dessus, commentez sur l’impact du capital public

et des ses composantes sur le niveau de production privé.