Recherche scientifique idéalisée :
Recherche empirique en finance dans le milieu universitaire :
Idéalement, la recherche impliquerait des objectifs où les conclusions peuvent bénéficier au public, d’où l’idée de publier.
Cela a-t-il du sens dans la finance empirique ?
Recherche empirique en finance dans l’industrie :
Cela est dû au fait que l’asymétrie de l’information sur les marchés est ce qui crée des opportunités pour les investisseurs.
Question : Si les incitatifs sont parfois alignés contre la recherche financière empirique collaborative et open source, devrions-nous nous attendre à ce que la recherche soit reproductible?
Question de suivi : si les incitatifs font que la publication est hautement récompensée, pouvons-nous nous attendre à ce que la recherche publiée soit une recherche “authentique”?
C’est une question importante en finance empirique :
Data mining, alias p-hacking:
En conclusion, en tant que bons statisticiens, notre objectif est d’éviter le data mining de notre méthodologie de recherche tout en limitant les biais statistiques le cas échéant, et de reconnaître ces problèmes lors de l’évaluation des résultats d’autres chercheurs.
De nombreux éléments peuvent causer des résultats biaisés et invalides :
Il conclut qu’il est probable que la plupart des découvertes scientifiques sont plus fausses que vraies, étant des mesures précises de biais plutôt que des résultats rigoureux.
Nous avons vu que dans le cadre de finance empirique, les incitations financières et la flexibilité dans la conception peuvent jouer un rôle important dans la conduite des résultats.
Pourquoi la plupart des résultats médicaux sont-ils faux ?
Définitions
Voir xkcd
Le théorème de Bayes implique:
\begin{align*} PPV & =\Pr\left( H_{0}=F|S=f\right) =\frac{\Pr\left( H_{0}=F,S=f\right)}{\Pr\left( S=f\right)}\\ &=\frac{\left( 1-\beta\right) \cdot\Pr\left( H_{0}=F\right)}{\left( 1-\beta\right) \cdot\Pr\left( H_{0}=F\right) +\alpha\cdot\Pr\left( H_{0}=T\right)}\\ &=\frac{\left( 1-\beta\right) \cdot R}{\left( 1-\beta\right) \cdot R+\alpha} \end{align*}
\therefore Les résultats de recherche sont plus vraisemblablement bons que faux
\iff\left( 1-\beta\right) \cdot R>\alpha\approx0.05
Implications
Tests répétés
Maintenant,
PPV = \frac{\left( 1-\beta^{n}\right) \cdot R}{\left( 1-\beta^{n}\right) \cdot R+\left[ 1-\left( 1-\alpha\right) ^{n}\right]} \approx \frac{\left( 1-\beta^{n}\right) \cdot R}{\left( 1-\beta^{n}\right) \cdot R+\left[ 1-.95^{n}\right]}
Les résultats de la recherche sont plus vraisemblablement bons que faux
\iff\left( 1-\beta^{n}\right) \cdot R>1-\left( 1-\alpha\right) ^{n}
Augmenter n peut rendre plus difficile la satisfaction de cette condition!
Les études d’évaluation des actifs cherchent à répondre à une variété de questions de recherche, mais elles partagent généralement:
Des raisons suffisantes pour que les chercheurs s’inquiètent de MHT dans les études de prévisibilité financière.
Les inférences ne peuvent être faites qu’en formulant des hypothèses explicites sur le processus de génération de données et la capacité des chercheurs à filtrer les stratégies non valables.
Dans leur étude, les seuils ajustés pour les t-statistiques des alphas en séries temporelles et les pentes des régressions FM transversales sont respectivement de 3.8 et 3.4, impliquant que 1,028 et 4,790 tests doivent être tentés pour avoir une probabilité de 50% de respecter le seuil.
Important Il n’y a pas de norme absolue de \alpha pour les tests d’hypothèses, généralement, seulement des directives acceptées pour la recherche statistique.
Important Considérez également que les auteurs ont besoin d’une théorie, d’une motivation ou d’une histoire pour être publiés. Même chose en finance d’entreprise.
➡️ Cela augmente R dans les formules d’Ioannidis.
De nombreux autres problèmes potentiels préoccupent le domaine de la finance empirique. Nous allons discuter de trois :
Comprendre les variations entre les seuils de significativité des facteurs Fama-French en fonction de la date à laquelle ils ont été téléchargés.
Ils constatent que les rendements des facteurs diffèrent significativement selon millésime des facteurs, qui cause un tiers des anomalies portefeuilles long-short à perdre leur significativité statistique.
Comment est-ce possible ?
Question Si de si petits écarts en méthodologie ont un impact si important sur les résultats de l’étude, quels autres problèmes cachés pourraient exister qui sont actuellement négligés par les chercheurs ?

HML est le facteur le plus affecté.

\alpha des portefeuilles bien diversifiés sont significativement affectés.

Le premier article empirique crowdsourcé en Économie/Finance. Le projet cherche à exposer la variation entre les chercheurs pour les résultats qu’ils rapportent en testant indépendamment les mêmes hypothèses sur le même échantillon.
343 auteurs provenant de 34 pays répondant aux mêmes questions d’évaluation d’actifs :


Harvey (2022) : oui, mais les incitatifs font en sorte de le réduire.
I believe p-hacking is less of a problem in asset management than in academia—in particular, less of a problem in the proprietary research that is the foundation for a product. The reasons are simple. First, in the presence of a performance fee, the asset management company’s research needs to be optimized in a way that maximizes the chances of repeatable performance. This means the asset manager does not choose the best-performing backtest, because it is the one that is most likely to be overfit. If the manager were to launch a backtest-overfitted strategy, it would likely fail and thereby generate no performance fees. The second reason is reputation. Academic tenure has no equivalent in asset management. If an asset manager’s products disappoint because of overfitting, the firm’s investors will flee. This market mechanism naturally minimizes the overfitting. That said, asset management companies still produce a substantial amount of low-quality research. Similar to the academic research, investors need to be skeptical.
L’un des groupes qui a tenté de mesurer la robustesse des études passées en évaluation d’actifs en réévaluant la force des facteurs établis.
Conception de l’étude :
Accent sur l’impact du contrôle pour les actions micro-cap :
Est-il réaliste de considérer les stratégies significatives presque uniquement sur le comportement de ce (petit) sous-échantillon d’actions?
La plupart des investisseurs ne prioriseront pas les micro-caps dans la conception de leur stratégies!
Conclusion Bien que l’influence des micro-caps soit écrasante dans les études de tarification des actifs, elle est presque inexistante dans la gestion d’argent réelle.
Pour Chen et Zimmerman, les études de réplication passées mesurent la prévisibilité en s’écartant des méthodes utilisées dans la recherche originale. - Si la méthode est différente, les résultats seront sûrement différents !
Important La réplication doit être réalisée dans les mêmes conditions exactes que dans l’étude originale. La méthodologie doit être suivie précisément et les hypothèses doivent être extrêmement limitées.

Importance des pratiques éthiques parmi les scientifiques:
Il n’y a pas moyen d’y échapper, si votre méthode initiale est fausse, chaque conclusion qui en découle est fausse.
The authors hereby retract the above article, published in print in the April 2020 issue of The Journal of Finance. A replication study finds that the replication code provided in the supplementary information section of the article does not reproduce some of the central findings reported in the article. Upon reexamination of the work, the authors confirmed that the replication code does not fully reproduce the published results and were unable to provide revised code that does. Therefore, the authors conclude that the published results are not reliable and that the responsible course of action is to retract the article and return the Brattle Group Distinguished Paper Prize that the article received. The authors deeply regret the damage this caused to the journal and the scholarly community. The specific contributions of the authors to the article were as follows: the first and second author provided the theoretical hypothesis; all three authors jointly designed the empirical approach and identification strategy; the third author constructed and handled the data, implemented the empirical analysis, and provided the empirical results as well as the replication data and code. The third author states that the original data and code that produced the published results were lost. The first and second author were not notified of the loss of the original data and code at the time it occurred and had no prior knowledge of the issues with the replication data and code provided to the journal.
Alors que les avancées technologiques deviennent prédominantes dans la recherche académique et industrielle, les scientifiques ont la possibilité de rendre leur travail propice à la réplication avec une documentation adéquate et une exposition rigoureuse.
Le projet The Turing Way :
➡️ Lorsque les chercheurs emploient la transparence dans leur recherche - en d’autres termes, lorsqu’ils documentent et partagent correctement les données et les processus associés à leurs analyses - la communauté scientifique au sens large est en mesure d’économiser un temps précieux lors de la reproduction ou de l’élaboration des résultats publiés.



MATH60230