MATH60230 - Séance 8

Vincent Grégoire

HEC Montréal

Saad Ali Khan

HEC Montréal

Plan

  • Données de panel
  • Biais de variable omise
  • Effets fixes
  • Erreurs standards groupées

Données de panel

Introduction

Un ensemble de données est sous la forme d’un “panel” lorsque nous avons plusieurs observations (généralement au fil du temps) sur chaque individu ou unité pour chaque variable.

Y_{it}\equiv la valeur de la variable Y pour l’individu i au temps t
pour t=1,\ldots,T et i=1,\ldots,N

  • Séries de prix, dividendes et bénéfices pour de nombreuses actions
  • Séries de rendements obligataires pour divers gouvernements ou échéances ou cotes de crédit
  • Séries de prix à terme à diverses échéances ou prix d’options à divers prix d’exercice

Exemple : SEC MIDAS LitVol(’000)

Ticker A AA AACI AADI AAGR AAL AAMC AAME AAN AAOI ... ZTEK ZTS ZUMZ ZUO ZVIA ZVRA ZVSA ZWS ZYME ZYXI
Date
2024-07-01 800.319 995.683 0.0 82.344 322.091 8315.465 2.82 0.051 431.808 737.982 ... 4.05 429.642 173.062 383.065 66.869 180.628 3.565 368.583 70.457 55.611
2024-07-02 535.32 1286.891 0.0 186.901 260.099 6145.214 5.266 1.673 352.509 993.449 ... 5.367 540.356 149.839 327.406 65.792 86.322 0.985 304.206 103.186 50.952
2024-07-03 353.257 1647.61 0.002 56.845 116.272 4710.886 0.002 0.064 119.644 391.225 ... 6.211 349.412 80.541 136.898 54.816 35.157 1.181 215.671 26.862 16.952
2024-07-05 284.856 822.498 0.0 147.106 329.09 7176.805 1.172 1.604 228.559 640.502 ... 1.898 358.113 116.616 228.105 65.782 79.242 1.78 203.873 88.066 28.105
2024-07-08 354.793 1067.206 0.13 57.828 175.742 8213.584 1.771 2.342 190.217 980.914 ... 13.724 412.357 112.732 786.813 67.608 89.607 1.915 214.391 126.635 41.124
... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...
2024-09-24 232.23 3109.598 <NA> 59.912 53.658 8101.117 <NA> 1.067 476.413 2143.362 ... 0.895 363.573 88.349 268.977 36.054 745.519 10.586 408.781 122.893 23.035
2024-09-25 280.864 1593.902 <NA> 15.899 159.98 7245.156 <NA> 0.892 471.298 750.111 ... 5.189 347.512 92.502 209.866 67.828 742.23 14.732 309.973 112.524 20.077
2024-09-26 484.596 3132.624 <NA> 22.792 <NA> 18221.691 <NA> 4.106 934.983 940.721 ... 6.941 324.956 94.874 223.132 31.602 424.939 5.25 336.59 91.298 25.922
2024-09-27 535.44 1937.906 <NA> 34.539 <NA> 8583.044 <NA> 2.019 257.512 1098.977 ... 6.577 272.721 85.594 324.826 26.074 539.017 28.006 472.623 111.826 43.774
2024-09-30 392.812 976.334 <NA> 63.99 <NA> 7218.296 <NA> 3.844 2921.026 853.879 ... 3.356 369.675 107.455 304.86 38.376 315.584 5.785 347.917 128.399 19.274

64 rows × 3981 columns

Données en panel

Les ensembles de données en panel peuvent être :

  • Large (gros N) ou étroit (petit N)
  • Long (gros T) ou court (petit T)
  • Équilibré (T_i = T_j = T \; \forall \; i,j) ou déséquilibré (certains i ont plus d’observations que d’autres.)

Le panel précédent est :

  • Large (N=3981)
  • Relativement long (T=64)

Les panels déséquilibrés ne sont pas spécialement difficiles, mais l’algèbre devient plus complexe. Pour cette raison, nous allons parler uniquement des panneaux équilibrés.

Effets communs et regroupement

Supposons que nous voulons étudier l’impact des flux de trésorerie des entreprises CF sur les dépenses d’investissement des entreprises I. Qu’est-ce que cela veut dire?

  1. Voulons-nous savoir comment les dépenses d’investissement d’une entreprise réagissent durant les périodes où les flux de trésorerie sont élevés ?
  • Cela signifie que nous sommes intéressés par la variation dans le temps.
  • Nous pourrions effectuer une régression temporelle pour chaque i:
    I_{it}=stuff+\beta_{i}\cdot CF_{it}+e_{it}

MIDAS

Security McapRank TurnRank VolatilityRank PriceRank LitVol('000) OrderVol('000) Hidden TradesForHidden HiddenVol('000) TradeVolForHidden('000) Cancels LitTrades OddLots TradesForOddLots OddLotVol('000) TradeVolForOddLots('000)
Ticker Date
A 2024-07-01 Stock 10.0 7.0 3.0 9.0 800.319 37442.439 5802.0 23316.0 366.567 1166.886 274839.0 17330.0 17147.0 23127.0 396.583 1161.27
2024-07-02 Stock 10.0 6.0 3.0 9.0 535.32 44473.496 4714.0 18956.0 248.298 783.618 309707.0 14202.0 15164.0 18912.0 324.794 781.162
2024-07-03 Stock 10.0 7.0 3.0 9.0 353.257 24631.062 3832.0 12598.0 232.964 586.221 160482.0 8739.0 9697.0 12571.0 231.621 585.058
2024-07-05 Stock 10.0 5.0 2.0 9.0 284.856 30088.535 2901.0 12704.0 135.068 419.924 228535.0 9772.0 10699.0 12672.0 185.578 419.138
2024-07-08 Stock 10.0 7.0 1.0 9.0 354.793 24877.289 3355.0 13779.0 180.036 534.829 217195.0 10407.0 11166.0 13761.0 224.297 533.815
... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...
ZYXI 2024-09-24 Stock 4.0 2.0 5.0 4.0 23.035 2757.671 128.0 816.0 4.395 27.43 22132.0 686.0 694.0 814.0 12.818 27.327
2024-09-25 Stock 4.0 2.0 5.0 4.0 20.077 2233.598 105.0 743.0 2.271 22.348 20306.0 636.0 657.0 741.0 12.3 22.329
2024-09-26 Stock 4.0 2.0 5.0 4.0 25.922 2236.208 195.0 870.0 5.82 31.742 20308.0 669.0 751.0 864.0 16.211 31.629
2024-09-27 Stock 4.0 3.0 9.0 4.0 43.774 3139.279 535.0 1430.0 15.749 59.523 28486.0 887.0 1168.0 1422.0 20.682 59.276
2024-09-30 Stock 4.0 2.0 6.0 4.0 19.274 2357.55 72.0 593.0 1.699 20.973 23045.0 521.0 503.0 593.0 9.63 20.973

248961 rows × 17 columns

Effets communs et regroupement

  1. Voulons-nous savoir si les entreprises avec des flux de trésorerie plus élevés tendent à investir plus que celles avec des flux de trésorerie plus faibles ?
  • Cela signifie que nous sommes intéressés par la variation entre les entreprises.
  • Nous pourrions effectuer une régression transversale pour chaque t:
    I_{it}=stuff+\beta_{t}\cdot CF_{it}+e_{it}

MIDAS

Security McapRank TurnRank VolatilityRank PriceRank LitVol('000) OrderVol('000) Hidden TradesForHidden HiddenVol('000) TradeVolForHidden('000) Cancels LitTrades OddLots TradesForOddLots OddLotVol('000) TradeVolForOddLots('000)
Date Ticker
2024-07-01 A Stock 10.0 7.0 3.0 9.0 800.319 37442.439 5802.0 23316.0 366.567 1166.886 274839.0 17330.0 17147.0 23127.0 396.583 1161.27
AA Stock 9.0 9.0 5.0 8.0 995.683 69573.964 2350.0 19386.0 159.781 1155.464 305304.0 16885.0 13209.0 19225.0 335.835 1150.461
AACI Stock 3.0 1.0 1.0 5.0 0.0 33.711 0.0 0.0 0.0 0.0 77.0 0.0 0.0 0.0 0.0 0.0
AADI Stock 2.0 8.0 6.0 2.0 82.344 2807.266 216.0 1105.0 15.517 97.861 13498.0 883.0 674.0 1099.0 22.437 97.64
AAGR Stock 1.0 10.0 10.0 1.0 322.091 8819.409 728.0 1855.0 177.737 499.828 6567.0 1123.0 326.0 1850.0 11.157 494.757
... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...
2024-09-30 ZVRA Stock 5.0 9.0 8.0 4.0 315.584 14270.604 1053.0 4522.0 77.934 393.518 50675.0 3456.0 2760.0 4508.0 79.422 393.229
ZVSA Stock 1.0 9.0 7.0 2.0 5.785 206.686 15.0 100.0 1.118 6.903 1260.0 85.0 72.0 100.0 2.568 6.903
ZWS Stock 8.0 7.0 2.0 7.0 347.917 20885.803 1660.0 8262.0 89.895 437.812 184048.0 6588.0 5949.0 8244.0 138.253 436.824
ZYME Stock 6.0 8.0 5.0 5.0 128.399 7992.542 887.0 3718.0 24.615 153.014 75387.0 2821.0 2952.0 3708.0 60.181 152.852
ZYXI Stock 4.0 2.0 6.0 4.0 19.274 2357.55 72.0 593.0 1.699 20.973 23045.0 521.0 503.0 593.0 9.63 20.973

248961 rows × 17 columns

Effets communs et regroupement

  • Que se passe-t-il si le premier effet est constant entre les entreprises ?
  • Que se passe-t-il si le second effet est constant dans le temps ?

En effectuant N ou T régressions séparées, nous utiliserons nos données de manière inefficace.
Cela signifie que les erreurs standards sont plus grandes que nécessaire.

  • Au lieu de cela, nous pourrions effectuer une régression comme
    I_{it}=stuff+\beta\cdot CF_{it}+e_{it}

  • Nous appelons cela une régression panel.

    Cela restreint \beta_i = \beta_t = \beta

  • Nous appelons cela la restriction d’effet commun ou de pooling.

Nous pouvons estimer la régression ci-dessus en utilisant OLS simplement en empilant nos données.

Empilage de y

\mathbf{y} = \left[\begin{array}{c}y_{1,1}\\ y_{1,2}\\ \vdots \\ y_{1, T} \\ y_{2,1}\\ y_{2,2}\\ \vdots \\ y_{2, T}\\ y_{I,1}\\ \vdots \\ y_{I, T} \end{array} \right]

Empilage de X

\mathbf{X} = \left[\begin{array}{ccccc} x_{1, 1}^{(1)} & x_{1, 1}^{(2)} & \cdots & x_{1, 1}^{(K-1)} & x_{1,1}^{(K)} \\ x_{1, 2}^{(1)} & x_{1, 2}^{(2)} & \cdots & x_{1, 2}^{(K-1)} & x_{1,2}^{(K)} \\ \vdots & \vdots & \ddots & \vdots & \vdots \\ x_{1, T}^{(1)} & x_{1, T}^{(2)} & \cdots & x_{1, T}^{(K-1)} & x_{1,T}^{(K)} \\ x_{2, 1}^{(1)} & x_{2, 1}^{(2)} & \cdots & x_{2, 1}^{(K-1)} & x_{2,1}^{(K)} \\ x_{2, 2}^{(1)} & x_{2, 2}^{(2)} & \cdots & x_{2, 2}^{(K-1)} & x_{2,2}^{(K)} \\ \vdots & \vdots & \ddots & \vdots & \vdots \\ x_{2, T}^{(1)} & x_{2, T}^{(2)} & \cdots & x_{2, T}^{(K-1)} & x_{2,T}^{(K)} \\ x_{I, 1}^{(1)} & x_{I, 1}^{(2)} & \cdots & x_{I, 1}^{(K-1)} & x_{I,1}^{(K)} \\ x_{I, 2}^{(1)} & x_{I, 2}^{(2)} & \cdots & x_{I, 2}^{(K-1)} & x_{I,2}^{(K)} \\ \vdots & \vdots & \ddots & \vdots & \vdots \\ x_{I, T}^{(1)} & x_{I, T}^{(2)} & \cdots & x_{I, T}^{(K-1)} & x_{I,T}^{(K)} \end{array} \right]

Restriction de pooling

Nous pouvons tester la restriction de pooling tout comme toute autre restriction similaire en OLS.

Supposons que nous testions \beta_i = \beta \; \forall i ; cela représente R = N-1 restrictions.

  • Nous effectuons nos N régressions de séries temporelles et obtenons N séries différentes de résidus \{\hat{e}_{i,1}, \ldots, \hat{e}_{i,T}\}
  • RSS_U \equiv \sum_{i=1}^N ( \sum_{t=1}^T \hat{e}_{i,t}^2 )
  • Puis nous exécutons une régression sur nos données empilées et obtenons une série de résidus \{\hat{u}_{1}, \ldots, \hat{u}_{N \cdot T}\}
  • RSS_R \equiv \sum_{t=1}^{N \cdot T} \hat{u}_{t}^2
  • Nous pouvons alors calculer la statistique F habituelle F = \frac{RSS_R - RSS_U}{RSS_U} \cdot \frac{N \cdot (T - k)}{R} \sim F(R,N \cdot (T - k)) \; \text{sous} \; H_0 k = 1 + le nombre de variables dans stuff.

Biais de variable omise

Rappelons notre révision de l’OLS, où nous avons mentionné une méthode alternative pour estimer \widehat{\beta}_{i} :

  1. Régressons y sur toutes les autres variables X_{j}\neq X_{i} et sauvegardons les résidus \widehat{\varepsilon}_{y}.
  2. Régressons X_{i} sur toutes les autres variables X_{j}\neq X_{i} et sauvegardons les résidus \widehat{\varepsilon}_{x}.
  3. \widehat{\beta}_{i} est le coefficient de la régression de \widehat{\varepsilon}_{y} sur \widehat{\varepsilon}_{x}.

Cela montre que \widehat{\beta}_{i} capture l’effet de X_{i} sur y qui ne peut pas être expliqué par d’autres variables X_{j}.

Problème

Que se passe-t-il si nous avons oublié d’inclure une variable importante X_{j} ?
Alors nous pourrions avoir un biais de variable omise !

Supposons que le vrai modèle est
y_{t}=\beta_{X}\cdot X_{t}+\beta_{Z}\cdot Z_{t}+e_{t}
mais que nous omettons Z_{t} et utilisons à la place OLS pour estimer

y_{t}=\beta_{X}\cdot X_{t}+e_{t}

Est-ce que \widehat{\beta}_{X} sera biaisé ?

\begin{aligned} E(\widehat{\beta}_{X}) &=\operatorname{Cov}\left( y_{t},X_{t}\right) \cdot\operatorname{Var}\left( X_{t}\right)^{-1}\\ &= \operatorname{Cov}\left( \beta_{X}\cdot X_{t}+\beta_{Z}\cdot Z_{t}+e_{t},X_{t}\right) \cdot\operatorname{Var}\left( X_{t}\right)^{-1}\\ &= \left[ \beta_{X}\cdot\operatorname{Var}\left( X_{t}\right) +\beta_{Z}\cdot\operatorname{Cov}\left( Z_{t},X_{t}\right) +\operatorname{Cov}\left( e_{t},X_{t}\right) \right] \cdot\operatorname{Var}\left( X_{t}\right)^{-1}\\ &= \beta_{X}+\beta_{Z}\cdot\operatorname{Cov}\left( Z_{t},X_{t}\right)\cdot\operatorname{Var}\left( X_{t}\right)^{-1}\\ &= \beta_{X}+\beta_{Z}\cdot\beta_{ZX} \end{aligned}

Donc, biais \iff \beta_{Z}\cdot\beta_{ZX} \neq 0.

Biais de variable omise

Nous pourrions penser que de nombreuses choses autres que CF influencent I :

  • Les entreprises dans des industries à forte intensité de capital (par exemple, la production d’électricité, fabrication aéronautique) pourraient investir plus que celles d’autres industries (par exemple, franchises de restauration rapide).
  • Les entreprises pourraient investir beaucoup moins que d’habitude lors de récessions (faible demande) ou plus que d’habitude lorsque les taux d’intérêt sont faibles.

Si nous n’ajoutons pas de variables supplémentaires pour contrôler ces effets, nos estimations de \beta peuvent être biaisées.

  • CF_{it} est-il corrélé avec la ou les variables manquantes ?

C’est pourquoi nous avons inclus stuff dans les régressions panel ci-dessus.

Effets fixes

Problème

Que faire si nous n’avons pas de données sur les variables manquantes ?

Solution

Dans de nombreux cas (mais pas tous), nous pouvons ajouter un ensemble de variables indicatrices.

Nous appelons cela les fffets fixes.

Effets fixes d’entreprise (ou entité)

Cas 1 :

Les variables manquantes sont constantes au fil du temps t mais pas pour chaque i.

  • Nous pouvons ajouter N variables indicatrices, une pour chaque valeur de i.
  • Elles captureront l’effet global de toutes les variables omises qui sont constantes dans le temps.

Exemple

Si I_{it} dépend de CF_{it} et de l’industrie de l’entreprise, ces variables indicatrices captureront cet effet.

Effets fixes de temps

Cas 2

Les variables manquantes sont constantes pour chaque i mais pas dans le temps t.

  • Nous pouvons ajouter T variables indicatrices, une pour chaque période de temps t.
    Nous appelons cela les effets fixes de temps.
  • Elles captureront l’effet global de toutes les variables omises qui sont les mêmes pour tous les i.

Exemple

Si I_{it} dépend de CF_{it} et de la croissance du PIB ou de l’écart de production, ces variables indicatrices captureront ces effets.

Effets fixes d’entreprise et de temps

Cas 3

Certaines variables manquantes sont constantes pour chaque i, d’autres pour chaque t.

  • Nous pouvons ajouter N+T variables indicatrices, une pour chaque période de temps t et une pour chaque valeur de i.
  • Nous avons largement assez d’observations pour estimer les deux ! (N \cdot T \gg N + T)

Effets fixes

Quelques points à noter :

  1. Inclure toutes les variables indicatrices N ou T signifie que nous ne pouvons pas également inclure une constante !
  2. Inclure les effets fixes de temps signifie que nous ne pouvons inclure aucune variable qui varie uniquement dans le temps (par exemple, les taux des bons du Trésor, les rendements du portefeuille de marché, etc.)
  3. Nous pourrions inclure un nombre moins élevé de variables indicatrices si nous le souhaitons. (une par code postal ? code SIC ? année ?)
  4. Parce que nous sommes intéressés par \beta, nous ne rapportons généralement pas les (nombreux!) coefficients sur les variables indicatrices.

Effets fixes

Le modèle à effets fixes ressemble à
I_{it}=\alpha_{i}+\beta\cdot CF_{it}+e_{it}

C’est équivalent à utiliser OLS pour estimer
I_{it}=\left( \sum_{j=1}^N\alpha_{j}\cdot D_{j}\right) +\beta\cdot CF_{it}+e_{it}
D_{j}=1 pour l’entreprise j et =0 sinon.

Effets fixes

Cependant, ce n’est pas la manière dont les estimations des effets fixes sont généralement programmées.

  • Lorsque N est grand, notre matrice X'X est large.

  • L’inversion de grandes matrices est relativement lente.

  • Pour éviter cela, nous remplaçons chaque variable par son écart par rapport à sa valeur moyenne dans le temps.
    \tilde{y}_{it} \equiv y_{it} - T^{-1} \cdot \left( \sum_{t=1}^T y_{it} \right)

  • L’OLS sur \tilde{I}_{it}= \beta\cdot \tilde{CF}_{it}+e_{it} donnera des \hat{\beta}, \hat{e}_{it}, etc. identiques aux précédents, mais sera bien plus rapide !

C’est une des raisons pour lesquelles nous aimons utiliser du code optimisé pour les données de panel.

Estimation des modèles de données de panel

linearmodels

Package Python pour estimer des modèles linéaires en finance et en économie :

  • Par Kevin Sheppard, Université d’Oxford
  • Modèles de données de panel avec effets fixes (PanelOLS)
  • Estimation de Fama-MacBeth (FamaMacBeth)
  • Modèles à variables instrumentales : moindres carrés en deux étapes (IV2SLS) - prochaine séance
  • Méthode généralisée des moments (GMM, IVGMM)
  • Estimation et test de modèles d’évaluation d’actifs - prochain cours
  • ➕➕➕ beaucoup plus

Inférence

Problème

Comment testons-nous les hypothèses sur \beta ?

Solution

Traitez comme pour OLS !

Problème

L’inférence OLS suppose que les erreurs sont i.i.d.

  • Cela signifie que E(e_{it} \cdot e_{jt}) = 0 = E(e_{it} \cdot e_{i\tau}) \quad \forall i \neq j, t \neq \tau
  • Cela est souvent peu réaliste !

Solution

C’est souvent difficile !

  • Si nous connaissons la structure des corrélations, nous pouvons essayer de compenser (ajout de retards, ou utilisation d’erreurs standards ‘groupées’).
  • Si nous ne le savons pas, mais que N, T sont “grands”, nous pouvons utiliser des corrections non paramétriques.

Erreurs standards groupées

Nous pouvons écrire l’équation de régression panel comme :

y_{i,t}=X_{i,t}\beta+\varepsilon_{i,t}

Nous savons que si nous estimons \beta avec OLS, l’estimateur aura la variance suivante :

Var\left( \widehat{\beta}_{OLS}\right) =\sigma_{\varepsilon}^{2}\cdot\left(X^{\prime}X\right) ^{-1}

lorsque les erreurs \varepsilon_{i,t} sont i.i.d.

Problème

Mais que se passe-t-il si les erreurs sont corrélées au sein de chaque entreprise i ou période de temps t ?

Erreurs standards groupées

Supposons que les données ont un effet d’entreprise non observé qui est fixe :

X_{i,t} = \alpha_i + \nu_{i,t}.

Les résidus peuvent être spécifiés comme

\varepsilon_{i,t} = \gamma_i + \eta_{i,t}.

Erreurs standards groupées

À la fois la variable indépendante et le résidu sont corrélés entre les observations de la même entreprise, mais sont indépendants entre les entreprises :

\begin{aligned} corr(X_{i,t}, X_{j,s}) &= 1 \text{ pour } i=j \text{ et } t=s\\ &= \rho_{X} = \sigma^2_{\alpha} / \sigma^2_X \text{ pour } i=j \text{ et tous } t\neq s\\ &= 0 \text{ pour tous } i\neq j \end{aligned}

\begin{aligned} corr(\varepsilon_{i,t}, \varepsilon_{j,s}) &= 1 \text{ pour } i=j \text{ et } t=s\\ &= \rho_{\varepsilon} = \sigma^2_{\gamma} / \sigma^2_{\varepsilon} \text{ pour } i=j \text{ et tous } t\neq s\\ &= 0 \text{ pour tous } i\neq j. \end{aligned}

Alors la variance de \widehat{\beta} est

Var\left( \widehat{\beta}\right) = \frac{\sigma^2_{\varepsilon}}{\sigma^2_{X} NT} (1+(T-1)\rho_X \rho_{\varepsilon}).

Erreurs standards groupées

La formule exacte pour l’erreur standard groupée est :

Var\left( \widehat{\beta}_{firm}\right) = \frac{N(NT-1)\sum_{i=1}^N\left(\sum_{t=1}^T X_{i,t}\varepsilon_{i,t}\right)^2}{(NT-k)(N-1)\left(\sum_{i=1}^N\sum_{t=1}^T X_{i,t}^2\right)^2}.

  • Puisque les autocorrelations peuvent être positives ou négatives, il est possible que l’erreur standard OLS sous- ou surestime l’erreur standard réelle.
  • La corrélation des résidus au sein d’un cluster est le problème que les erreurs standards groupées sont conçues pour corriger.
  • Cette corrélation peut être de n’importe quelle forme; aucune structure paramétrique n’est supposée. Cependant, la somme au carré de X_{i,t}\varepsilon_{i,t} est supposée avoir la même distribution à travers les clusters.

Erreurs standards groupées par entreprise

Entreprise 1 Entreprise 2 Entreprise 3
Entreprise 1 \epsilon_{11}^2 \epsilon_{11}\epsilon_{12} \epsilon_{11}\epsilon_{13} 0 0 0 0 0 0
\epsilon_{12}\epsilon_{11} \epsilon_{12}^2 \epsilon_{12}\epsilon_{13} 0 0 0 0 0 0
\epsilon_{13}\epsilon_{11} \epsilon_{13}\epsilon_{12} \epsilon_{13}^2 0 0 0 0 0 0
Entreprise 2 0 0 0 \epsilon_{21}^2 \epsilon_{21}\epsilon_{22} \epsilon_{21}\epsilon_{23} 0 0 0
0 0 0 \epsilon_{22}\epsilon_{21} \epsilon_{22}^2 \epsilon_{22}\epsilon_{23} 0 0 0
0 0 0 \epsilon_{23}\epsilon_{21} \epsilon_{23}\epsilon_{22} \epsilon_{23}^2 0 0 0
Entreprise 3 0 0 0 0 0 0 \epsilon_{31}^2 \epsilon_{31}\epsilon_{32} \epsilon_{31}\epsilon_{33}
0 0 0 0 0 0 \epsilon_{32}\epsilon_{31} \epsilon_{32}^2 \epsilon_{32}\epsilon_{33}
0 0 0 0 0 0 \epsilon_{33}\epsilon_{31} \epsilon_{33}\epsilon_{32} \epsilon_{33}^2

Erreurs standards groupées

Le même principe s’applique aux effets de temps :

\begin{aligned} X_{i,t} &= \zeta_t + \nu_{i,t}\\ \varepsilon_{i,t} &= \delta_t + \eta_{i,t} \end{aligned}

\Rightarrow Var\left( \widehat{\beta}_{time}\right) est le même que pour les erreurs groupées par entreprise, il suffit d’échanger T et N.

Erreurs standards groupées

Que se passe-t-il s’il y a à la fois des effets fixes d’entreprise et de temps ?

\begin{aligned} X_{i,t} &= \alpha_i +\zeta_t + \nu_{i,t}\\ \varepsilon_{i,t} &= \gamma_i +\delta_t + \eta_{i,t} \end{aligned}

\Rightarrow Var\left( \widehat{\beta}_{firm\&time}\right) = Var\left( \widehat{\beta}_{firm}\right) + Var\left( \widehat{\beta}_{time}\right) - Var\left( \widehat{\beta}_{HC}\right)

Var\left( \widehat{\beta}_{HC}\right) sont les erreurs standards de White.

Erreurs standards groupées par entreprise et temps

Entreprise 1 Entreprise 2 Entreprise 3
Entreprise 1 \epsilon_{11}^2 \epsilon_{11}\epsilon_{12} \epsilon_{11}\epsilon_{13} \epsilon_{11}\epsilon_{21} 0 0 \epsilon_{11}\epsilon_{31} 0 0
\epsilon_{12}\epsilon_{11} \epsilon_{12}^2 \epsilon_{12}\epsilon_{13} 0 \epsilon_{12}\epsilon_{22} 0 0 \epsilon_{12}\epsilon_{32} 0
\epsilon_{13}\epsilon_{11} \epsilon_{13}\epsilon_{12} \epsilon_{13}^2 0 0 \epsilon_{13}\epsilon_{23} 0 0 \epsilon_{13}\epsilon_{33}
Entreprise 2 \epsilon_{21}\epsilon_{11} 0 0 \epsilon_{21}^2 \epsilon_{21}\epsilon_{22} \epsilon_{21}\epsilon_{23} \epsilon_{21}\epsilon_{31} 0 0
0 \epsilon_{22}\epsilon_{12} 0 \epsilon_{22}\epsilon_{21} \epsilon_{22}^2 \epsilon_{22}\epsilon_{23} 0 \epsilon_{22}\epsilon_{32} 0
0 0 \epsilon_{23}\epsilon_{13} \epsilon_{23}\epsilon_{21} \epsilon_{23}\epsilon_{22} \epsilon_{23}^2 0 0 \epsilon_{23}\epsilon_{33}
Entreprise 3 \epsilon_{31}\epsilon_{11} 0 0 \epsilon_{31}\epsilon_{21} 0 0 \epsilon_{31}^2 \epsilon_{31}\epsilon_{32} \epsilon_{31}\epsilon_{33}
0 \epsilon_{32}\epsilon_{12} 0 0 \epsilon_{32}\epsilon_{22} 0 \epsilon_{32}\epsilon_{31} \epsilon_{32}^2 \epsilon_{32}\epsilon_{33}
0 0 \epsilon_{33}\epsilon_{13} 0 0 \epsilon_{33}\epsilon_{23} \epsilon_{33}\epsilon_{31} \epsilon_{33}\epsilon_{32} \epsilon_{33}^2

Lectures complémentaires

Facultatif : Le reste de Baltagi (2022) chap 12 aborde des sujets de plus en plus sophistiqués :

  • Effets aléatoires (12.2.2)
  • Test du modèle groupé (12.5)
  • Modèles de données de panel dynamiques (12.6)
  • Estimation de différences en différences (12.7)

Références

Baltagi, Badi H. 2022. Econometrics. 6th ed. Classroom Companion: Economics. Springer Cham. https://doi.org/10.1007/978-3-030-80149-6.
Petersen, Mitchell A. 2008. “Estimating Standard Errors in Finance Panel Data Sets: Comparing Approaches.” The Review of Financial Studies 22 (1): 435–80.