
Site internet de la bibliothèque :
De nombreuses bases de données sont disponibles via le portail WRDS
Nouvelles
Données publiques disponibles :
La première étape consiste à identifier la question de recherche et les hypothèses, puis à concevoir la méthodologie en fonction des données disponibles.
La disponibilité des données est souvent contraignante pour la recherche. Nous utiliserons souvent des données provenant de sources standards (ex: WRDS), mais elles peuvent aussi provenir d’autres sources (données privées, web, etc.) —
Avant de faire toute analyse, nous devons connaître les données:
La première étape après le chargement des données devrait être de regarder les données:


Voir ma vidéo sur Data Wrangler pour une démo.
Format large (wide)
Chaque entité est une ligne, chaque période est une colonne.
date AAPL MSFT GOOGL
2024-01-01 0.012 0.008 0.015
2024-01-02 -0.005 0.003 0.002
Utiliser pour : Opérations matricielles, corrélations, stats transversales.
Format long (tidy)
Chaque observation est une ligne distincte.
date ticker return
2024-01-01 AAPL 0.012
2024-01-01 MSFT 0.008
2024-01-02 AAPL -0.005
Utiliser pour : Régressions, opérations groupées, filtrage.
| Opération | Direction | Fonction pandas |
|---|---|---|
| Pivot | Long → Large | df.pivot() ou df.pivot_table() |
| Melt | Large → Long | df.melt() |
| Unstack | Index → Colonnes | df.unstack() |
| Stack | Colonnes → Index | df.stack() |
pivot_table() lorsque vous avez des clés dupliquées (nécessite agrégation).df.pivot() et df.unpivot().

Considérons une fonction pour estimer la dérivée d’une autre fonction:
Supposons que nous ayons une fonction qui calcule le carré d’un nombre:
Vous pouvez maintenant passer square comme argument à deriv :
Note: \frac{\partial x^2}{\partial x} = 2x
def peut être exagéré.apply() dans pandas qui applique une fonction à chaque élément d’une série (une colonne).Pandas!
MATH60230