Revue des concepts en statistiques et probabilité:
CDF et PDF
Formule de Bayes
Estimateurs
Tests d’hypothèses classiques
Distributions empiriques:
Test d’adéquation
Graphiques Q-Q
Estimation de la densité par noyau
Fonction de distribution cumulative (CDF)
La fonction de distribution cumulative (CDF) d’une variable aléatoire X est:
F\left( x\right) = \Pr\left( X<x \right)
\Phi\left( x\right) \equiv~la CDF de la distribution normale standard N(0,1). (Aucune expression de forme fermée explicite)
CDF normale - N(\mu,\sigma)
Plot =require("https://cdn.jsdelivr.net/npm/@observablehq/plot@0.6.11/dist/plot.umd.min.js")d3 =require("d3")jStat =require('https://cdn.jsdelivr.net/npm/jstat@latest/dist/jstat.min.js')// Créer des curseurs avec une taille de texte plus petiteviewof mu = Inputs.range([-3,3], {step:0.1,value:0,label:tex`\text{loc: }\mu`,width:"450px"})viewof sigma = Inputs.range([0.1,3], {step:0.1,value:1,label:tex`\text{scale: }\sigma`,width:"450px"})// Disposer les curseurs côte à côtehtml`<div style="display: flex; gap: 100px; margin-bottom: 50px;">${viewof mu}${viewof sigma}</div>`
Cette formule relie les densités conditionnelles, marginales et conjointes. Soit X et Y deux variables aléatoires. Pour toute réalisation x \in X et y \in Y:
La probabilité conditionnelle est utilisée pour mettre à jour nos connaissances. Les formules ci-dessus sont écrites pour les densités de variables continues. Pour les variables discrètes, remplacez les densités par des probabilités.
Exemple de la formule de Bayes
L’arrivée de nouvelles financières peut:
Augmenter la volatilité des rendements du marché
Augmenter le volume échangé
Augmenter les coûts de transaction
Les nouvelles financières peuvent être modélisées comme une variable indicatrice (dummy) avec deux réalisations:
\begin{aligned}
\mathcal{I}_{Nouvelles}=
\begin{cases}
1, & \text{si une ou des nouvelles arrivent} \\
0, & \text{si aucune nouvelle n'arrive} \\
\end{cases}
\end{aligned}
Supposons que la volatilité du marché a deux états1, haut (H) et faible (L):
\begin{aligned}
\sigma=
\begin{cases}
\sigma_{H}, & \text{si} \ \sigma>5 \\
\sigma_{L}, & \text{si} \ \sigma \le 5 \\
\end{cases}
\end{aligned}
Distributions marginales
Approximation des distributions marginales des nouvelles et de la volatilité à partir des données:
Étant donné que nous observons \mathcal{I}_{Nouvelles}=1 nous aimerions calculer la probabilité que \sigma=\sigma_{H}:
\begin{aligned}
\mathcal{P}(\sigma=\sigma_{H}\vert \mathcal{I}_{Nouvelles}=1) & = \dfrac{\mathcal{P}(\sigma=\sigma_{H}, \mathcal{I}_{Nouvelles}=1)} {\mathcal{P}(\mathcal{I}_{Nouvelles}=1)}\\
& =\frac{0.062}{0.165}\\
& =0.376
\end{aligned}
Étant donné que nous observons \mathcal{I}_{Nouvelles}=0 nous aimerions calculer la probabilité que \sigma=\sigma_{H}:
\begin{aligned}
\mathcal{P}(\sigma=\sigma_{H}\vert \mathcal{I}_{Nouvelles}=0) & = \dfrac{\mathcal{P}(\sigma=\sigma_{H}, \mathcal{I}_{Nouvelles}=0)} {\mathcal{P}(\mathcal{I}_{Nouvelles}=0)}\\
& =\frac{0.249}{0.835}\\ & =0.298
\end{aligned}
Utiliser la loi de la probabilité totale au dénominateur:
\begin{aligned}
&= \dfrac{\mathcal{P}(\sigma=\sigma_{H}, \mathcal{I}_{Nouvelles}=1)} {\mathcal{P}(\sigma=\sigma_{H}\vert \mathcal{I}_{Nouvelles}=1)\mathcal{P}(\mathcal{I}_{Nouvelles}=1) + \mathcal{P}(\sigma=\sigma_{H}\vert \mathcal{I}_{Nouvelles}=0)\mathcal{P}(\mathcal{I}_{Nouvelles}=0)}\\
&= \dfrac{0.062} {(0.376 \times 0.165) + (0.298 \times 0.835) } \\
&=0.199
\end{aligned}
Conclusion sur la formule de Bayes
Haute volatilité conditionnelle sur nouvelles/pas de nouvelles:
\begin{aligned}
\mathcal{P}(\sigma=\sigma_{H}\vert \mathcal{I}_{Nouvelles}=1)&=0.376\\
\mathcal{P}(\sigma=\sigma_{H}\vert \mathcal{I}_{Nouvelles}=0)&=0.298
\end{aligned}
Arrivée des nouvelles conditionnelles sur la réalisation de haute/basse volatilité:
\begin{aligned}
\mathcal{P}(\mathcal{I}_{Nouvelles}=1 \vert \sigma=\sigma_{H})&=0.199\\
\mathcal{P}(\mathcal{I}_{Nouvelles}=1 \vert \sigma=\sigma_{L})&=0.149
\end{aligned}
Les nouvelles et la volatilité sont-elles liées?
Distributions des estimateurs
Supposons que nous avons une variable aléatoire X_{t}\sim N\left( \mu,\sigma^{2}\right) i.i.d.
Nous pouvons estimer \mu par la moyenne de l \overline{X}=\frac{1}{T}
\sum_{t=1}^{T}X_{t}.
X_{t}\sim N()\Rightarrow\overline{X} sera également distribuée normalement.
Quelle est la moyenne de \overline{X}?
E\left( \overline{X}\right) =E\left( \frac{1}{T}\sum_{t=1}^{T}X_{t}\right)
=\frac{1}{T}\sum_{t=1}^{T}E\left( X_{t}\right) =\frac{1}{T}\times T\cdot
\mu=\mu
Quelle est la variance de \overline{X}?
\begin{align*}
Var\left( \overline{X}\right) & =Var\left( \frac{1}{T}\sum_{t=1}^{T}%
X_{t}\right) \\
& =\frac{1}{T^{2}}\left( \sum_{t=1}^{T}Var\left( X_{t}\right) +2\sum
_{t=1}^{T}\sum_{\tau=t+1}^{T}Cov\left( X_{t},X_{\tau}\right) \right)
=\frac{\sigma^{2}}{T}%
\end{align*}
Convergence des moyennes échantillonnales
Supposons que X_{t}\sim i.i.d. avec une moyenne \mu et une variance \sigma^{2}.
Pas d’hypothèse de normalité! Juste l’indépendance…
La loi faible des grands nombres (Weak Law of Large Numbers) implique la convergence en probabilité
\overline{X}\overset{p}{\rightarrow}\mu\text{ lorsque }T\rightarrow\infty
Le théorème central limite (Central Limit Theorem) implique la convergence en distribution
\frac{\sqrt{T}\left( \overline{X}-\mu\right) }{\sigma}%
\overset{d}{\rightarrow}N(0,1)\text{ lorsque }T\rightarrow\infty
donc
\Pr\left( \frac{\sqrt{T}\left( \overline{X}-\mu\right) }{\sigma}<x\right)
\rightarrow\Phi\left( x\right) \text{ lorsque }T\rightarrow\infty
Convergence des moyennes échantillonnales
Intuition
Rappelons que si X_{t}\sim i.i.d.\left(\mu,\sigma^{2}\right) et \overline{X}=\frac{1}{T}\sum_{t=1}^{T}X_{t}, alors
E\left( \overline{X}\right) =\mu\text{ et }Var\left( \overline{X}\right)
=\frac{\sigma^{2}}{T}%
La convergence en probabilité \overline{X}\overset{p}{\rightarrow}\mu provient du fait que Var\left( \overline{X}\right) \rightarrow0 lorsque T\rightarrow\infty, ce qui implique que \overline{X} converge vers \mu lorsque T\rightarrow\infty.
La convergence en distribution nécessite que, même si \overline{X} converge vers \mu, elle ne sera jamais précisément égale à \mu. Si nous mettons à l’échelle la différence \overline{X}-\mu par un facteur de \frac{\sqrt{T}}{\sigma}, nous obtenons une déviation qui converge vers N(0,1) lorsque T\rightarrow\infty.
Illustration avec une simulation
Nous simulons T=10,000 tirages d’une distribution log-normale \sim e^{N(\mu,\sigma)}.1
Nous divisons l’échantillon en 400, 100 et 25 sous-échantillons (de 25, 100 et 400 observations) et calculons la moyenne pour chaque sous-échantillon.
Nous traçons la distribution des moyennes pour chaque taille de sous-échantillon.
La véritable moyenne de la distribution log-normale est e^{\left(\mu + \frac{1}{2}\sigma^2\right)} = e^{0.5} \approx1.65
La variance de la distribution est e^{2\mu+2\sigma^2}- e^{2\mu+\sigma^2} = e^2 - e \approx 4.67
L’écart-type est \sqrt{e^2 - e}\approx 2.16.
400 échantillons de 25 observations
100 échantillons de 100 observations
25 échantillons de 400 observations
Se rapprocher à un taux de √N
Propriétés souhaitables pour un estimateur
Si nous utilisons \widehat{\theta} pour estimer \theta, quelles propriétés pourrions-nous souhaiter?
Sans biais (Unbiasedness): \widehat{\theta} est un estimateur sans biais de \theta ssi :
E\left( \widehat{\theta}\right) =\theta
Convergent (Consistency): \widehat{\theta} est un estimateur convergent de \theta ssi :
\widehat{\theta}\overset{p}{\rightarrow}\theta\text{ lorsque }T\rightarrow\infty
Efficace: Lorsque \widehat{\theta}_{1} et \widehat{\theta}_{2} sont deux estimateurs sans biais de \theta, alors \widehat{\theta}_{1} est plus efficace que \widehat{\theta}_{2} ssi
Var\left( \widehat{\theta}_{1}\right) <Var\left( \widehat{\theta}%
_{2}\right)
\widehat{\theta} est un estimateur efficace s’il s’agit de l’estimateur à variance minimale.
La borne inférieure de Cramer-Rao donne la limite de variance minimale pour certaines distributions.
Intervalles de confiance
Un intervalle de confiance est un intervalle construit autour d’un estimateur \widehat{\theta} qui a une probabilité spécifiée de contenir \theta.
Exemple : Supposons X_{t}\sim N\left( \mu,\sigma^{2}\right) et \overline{X}=\frac{1}{T}\sum_{t=1}^{T}X_{t}
Les X_{t} sont gaussiens, donc \overline{X}\sim N\left( \mu,\frac{\sigma^{2}}{T}\right), ce qui implique \frac{\overline{X}-\mu}{\frac{\sigma}{\sqrt{T}}}\sim N\left( 0,1\right)
Supposons qu’il existe deux valeurs l et u telles que \Phi\left(
l\right) =\alpha/2 et \Phi\left( u\right) =1-\alpha/2. Par conséquent
\Pr\left( l<\frac{\overline{X}-\mu}{\frac{\sigma}{\sqrt{T}}}<u\right)
=1-\alpha
Un intervalle de confiance de niveau 1-\alpha pour la véritable moyenne \mu sera donc donné par
l<\frac{\overline{X}-\mu}{\frac{\sigma}{\sqrt{T}}}<u\Leftrightarrow\mu
\in\left[ \overline{X}-\frac{\sigma}{\sqrt{T}}u,\text{ }\overline{X}%
-\frac{\sigma}{\sqrt{T}}l\right]
Si \mu_{0} est dans l’intervalle de confiance 1-\alpha pour \mu, nous ne pouvons pas rejeter H_{0}.
Niveau de significativité
Rejeter ou accepter H_{0} dépend du choix de \alpha.
1-\alpha est appelé le seuil de confiance d’un test
\alpha est appelé le seuil de significativité d’un test
La taille d’un test est la probabilité que nous rejetions un véritable H_{0}.
Un test est valide lorsque sa taille n’est pas supérieure à son seuil de significativité \alpha
Lorsqu’un test souffre d’une distorsion de taille, ce n’est plus un test valide.
valeur p (p-value)
La valeur p d’un test est la plus petite valeur \alpha_{0} pour laquelle nous pouvons encore rejeter H_{0}.
Supposons \widehat{\theta}\sim t_{10} si H_{0}:\theta=0 est vraie.
Si \widehat{\theta}=2.5, alors p-value =1-F_{t_{10}}\left(2.5\right)=0.0157.
Si \widehat{\theta}=1.5, alors p-value =1-F_{t_{10}}\left(1.5\right)=0.0823.
Le seuil de significativité dépend de la valeur critique que nous choisissons.
La taille dépend également de la véritable distribution de \widehat{\theta} sous H_{0}.
La valeur p dépend à la fois de la distribution véritable de \widehat{\theta} sous H_{0} ainsi que de la valeur de notre statistique de test \widehat{\theta}.
Erreurs : Types I et II
Les tests d’hypothèse comportent deux types d’erreurs possibles :
Probabilité
si H_{0} est vraie
si H_{0} est fausse
de ne pas rejeter H_{0}
1-\alpha
\beta
de rejeter H_{0}
\alpha
1-\beta
\alpha est la probabilité d’erreur de type I.
\beta est la probabilité d’erreur de type II.
Dans les tests d’hypothèse classiques, nous contrôlons l’erreur de type I mais pas l’erreur de type II.
La théorie de la décision essaie d’équilibrer la probabilité des deux types d’erreurs.
Par exemple, en utilisant de grandes valeurs de \alpha lorsque T est petit et de petites valeurs de \alpha lorsque T est grand.
Pourquoi ? Si \alpha est fixe, \beta diminue lorsque T augmente.
Puissance d’un test
1-\beta est la puissance d’un test.
La puissance nous indique la probabilité de rejeter une hypothèse nulle qui est fausse.
La puissance dépend de l’hypothèse alternative. Une alternative qui est proche de la nullité sera plus difficile à rejeter qu’une alternative qui est éloignée de la nullité.
Supposons que l’hypothèse nulle est H_{0}:\mu=0
La puissance du test de H_{0} contre l’alternative H_{A}:\mu=6 sera beaucoup plus grande que celle du test de H_{0} contre l’alternative H_{A}:\mu=0.01.
Un bon statisticien garde à l’esprit à la fois la taille et la puissance de ses tests.
Lors de rejet de H_{0}, la taille du test compte.
Lorsque nous sommes incapable de rejeterH_{0}, la puissance du test importe.
Plus sur les Tests d’Hypothèse Classiques
Les tests d’hypothèses classiques ne sont vraiment informatifs que lorsque nous rejetons l’hypothèse nulle.
L’incapacité de rejeter la nulle n’implique pas que la nulle est correcte.
Ne dites jamais “les résultats du test prouvent que l’hypothèse nulle est correcte.”
Lorsque nous sommes incapables de rejeter l’hypothèse nulle, nous n’avons généralement aucune idée de la probabilité de la rejeter lorsqu’elle est fausse.
Cela ressemble beaucoup à un procès judiciaire.
Les gens sont innocents jusqu’à preuve du contraire.
Un verdict d’innocence ne prouve pas l’innocence. Cela signifie simplement qu’il n’y avait pas suffisamment de preuves pour condamner (c’est-à-dire un doute raisonnable).
Significativité économique et statistique
Significativité statistique Pouvons-nous rejeter l’hypothèse nulle à des niveaux de confiance typiques ?
Significativité économique La différence entre notre estimation et l’hypothèse nulle est-elle importante ou intéressante ?
Exemple Supposons que nous examinons l’\alpha1 annuel des stratégies de trading.
Si \widehat{\alpha}_{momentum}=0.1\% et nous rejetons l’hypothèse nulle : H_{0}:{\alpha}_{momentum}=0, la performance est statistiquement significative, mais pas économiquement.
Si \widehat{\alpha}_{secret}=22\% et que nous ne rejetons pas l’hypothèse nulle, la performance est toujours économiquement significative (et notre test manque de puissance).
Reproducibility Across many research fields, a “surprising” fraction of published findings don’t survive further scrutiny. (e.g. Drug trials, excess returns, economic policy impacts)
The list of references 26 in Health Science, 8 in Statistics, 5 Other, 0 Finance
Results “…much confusion and even doubt about the validity of science is arising. Such doubt can lead to radical choices, such as the one taken by the editors of Basic and Applied Social Psychology, who decided to ban p-values (null hypothesis significance testing).”
Underpinning many published scientific conclusions is the concept of “statistical significance,” typically assessed with an index called the p-value. While the p-value can be a useful statistical measure, it is commonly misused and misinterpreted. This has led to some scientific journals discouraging the use of p-values, and some scientists and statisticians recommending their abandonment, with some arguments essentially unchanged since p-values were first introduced.
Principles
p-values can indicate how incompatible the data are with a specified statistical model.
This incompatibility can be interpreted as casting doubt on or providing evidence against the null hypothesis or the underlying assumptions.
p-values do not measure the probability that the studied hypothesis is true, or the probability that the data were produced by random chance alone.
Researchers often wish to turn a p-value into a statement about the truth of a null hypothesis or about the probability that random chance produced the observed data. The p-value is neither.
Principles
Scientific conclusions and business or policy decisions should not be based only on whether a p-value passes a specific threshold.
Researchers should bring many contextual factors into play to derive scientific inferences, including the design of a study, the quality of the measurements, the external evidence for the phenomenon under study, and the validity of assumptions that underlie the data analysis.
The widespread use of “statistical significance” (generally interpreted as p\leq0.05) as a license for making a claim of a scientific finding (or implied truth) leads to considerable distortion of the scientific process.
Proper inference requires full reporting and transparency.
Valid scientific conclusions based on p-values and related statistics cannot be drawn without at least knowing how many and which analyses were conducted, and how those analyses (including p-values) were selected for reporting.
Principles
A p-value, or statistical significance, does not measure the size of an effect or the importance of a result.
Statistical significance is not equivalent to scientific, human, or economic significance.
By itself, a p-value does not provide a good measure of evidence regarding a model or hypothesis.
A relatively large p-value does not imply evidence in favor of the null hypothesis; many other hypotheses may be equally or more consistent with the observed data.
Principles
“What do you hope this statement will accomplish?”
We have big dreams for this statement. We’d love to see the practice of science with respect to its use of statistical inference undergo a cultural shift. We envision a “post p<0.05 era,” one in which scientific argumentation is not based on whether a p-value is small enough. In this era, attention would be paid to effect sizes and confidence intervals. …journals will stop using statistical significance to determine whether to accept an article. Instead, journals will accept papers based on a clear and detailed description of the study design, execution, and analysis. ….We won’t be left scratching our heads trying to sort out researcher degrees of freedom.
ASA President Jessica Utts, Amstat News, April 2016
Eugene Fama sur la statistique
“…I came to the University of Chicago in 1960…In my first year I took an intermediate statistics class with a professor named Harry Roberts…what I learned from Harry was a philosophy. He gave me an attitude toward statistics that has stuck with me ever since.
With formal statistics, you say something – a hypothesis – and then you test it. Harry always said that your criterion should be not whether or not you can reject or accept the hypothesis, but what you can learn from the data. The best thing you can do is use the data to enhance your description of the world. That has been the guiding light of my research. You should use market data to understand markets better, not to say this or that hypothesis is literally true or false. No model is ever strictly true. The real criterion should be: Do I know more about markets when I’m finished than I did when I started? Harry’s lesson is one that I’ve passed on to my students over the 49 years that I’ve been a teacher.
Intervalles de confiance
In recent decades, economic practices have evolved and focused on:
Identification
Economic and statistical significance
Using correct standard errors
New methods for dynamics, heterogeneity, and nonlinearities.
However, most papers concentrate on:
Whether the point estimates are statistically significantly different from zero.
Pourquoi les statistiques t ou p ne sont-elles pas suffisantes?
Sometimes we care about more than rejecting a value of 0.
Decision makers sometimes want to compare to a “threshold” for action.
A t-statistic of 2.1 or 2.6 is merely strong evidence against a value of zero, while a t-statistic of 4.0 is overwhelming evidence.
Smaller t-statistics provide strong evidence against a value of zero, they provide only moderate evidence against many values that are much closer to zero than to the point estimate.
It is rare for there to be no issues or concerns with the estimates and standard errors.
Solution
But, which interval to report?
With the traditional 2 standard error interval (\sim 95\%), boundary values are 7 times less likely than the point estimate. Is it worth reporting the whole range?
90% (1.645 standard error) bands, they appear to be the most natural alternative, point estimate is 4 times more likely than boundary values.
Even better, report both!
But, which interval to report?
With the traditional 2 standard error interval (\sim 95\%), boundary values are 7 times less likely than the point estimate. Is it worth reporting the whole range?
90% (1.645 standard error) bands, they appear to be the most natural alternative, point estimate is 4 times more likely than boundary values.
Even better, report both!
Tests d’Hypothèses Multiples
Explication du Problème
Se produit lorsque les chercheurs effectuent un grand nombre de tests similaires pour déterminer si une hypothèse nulle conjointe doit être rejetée.
Au fur et à mesure que de plus en plus de tests sont effectués, les lois de la probabilité indique que les chances de faux positifs deviennent très importantes.
Cela devient un problème lorsque le rejet d’une parmi plusieurs nulles est considéré comme une raison suffisante pour rejeter la nulle conjointe.
Supposons que nous souhaitons tester une hypothèse nulle conjointe à un seuil significativité de \alpha:
H_{0}:\mu_{i}=0,\text{ }\forall\text{ }i=1,...,N
L’hypothèse alternative est
H_{A}:\exists\text{ au moins un }i\text{ tel que }\mu_{i}\neq0
Nous pourrions faire un test séparé pour chaque paramètre \mu_{i}:
H_{0}^{(i)}:\mu_{i}=0,\text{ }i=1,...,N
Dès que nous trouvons un i pour lequel \left\vert t_{i}\right\vert >z_{\alpha} \Rightarrow rejeter H_{0}^{(i)},H_{0}
Si les tests sont indépendants, ils nous donneront un taux d’acceptation de H_{0} de \left( 1-\alpha\right) ^{N}, ce qui implique un taux de rejet de:
1-\left( 1-\alpha\right) ^{N}\neq\alpha
Tests de Bonferroni
Un test de Bonferroni ajuste simplement le seuil de significativité \alpha des tests individuels:
H_{0}^{(i)}:\mu_{i}=0,\text{ }i=1,...,N
Il utilise \left\vert t_{i}\right\vert >z_{\alpha/N}\Rightarrow rejeter H_{0}^{(i)}, i=1,...,N.
Cela donne un taux de rejet global pour H_{0}\leq\alpha.
Mais ces tests vérifient l’ensemble de la distribution; pour les tests, nous nous soucions principalement des queues (c’est-à-dire avons-nous les bonnes valeurs critiques?)
Quelle est la puissance de ces tests? dans les queues? Devons-nous nous inquiéter de l’erreur de type II?
Étant donné un échantillon \{X_{t}\}, ils tracent les quantiles de F\left( .\right) sur l’axe des x contre \widehat{F}\left( .\right) sur l’axe des y.
c’est-à-dire \{F^{-1}\left( \widehat{F}\left( X_{t}\right) \right)\} sur l’axe des x contre X_{t} sur l’axe des y \forall t.
Estimateur de densité par noyau
Un histogramme typique ressemble plus à la ligne d’horizon d’une grande ville qu’à une fonction de densité, et son apparence est sensible au nombre et à l’emplacement de ses cellules.
Un estimateur bien meilleur est l’estimateur de densité par noyau (kernel density estimator, KDE):
\widehat{f}(y) = \frac{1}{nb} \sum_{i=1}^{n} K \left(\frac{y-Y_i}{b}\right)
où b, qui est appelé la bande passante, détermine la résolution de l’estimateur. K est la fonction de noyau, qui est une fonction de densité de probabilité symétrique autour de 0. La fonction de densité normale standard est un choix courant pour K.
Estimateur de densité par noyau
Graphique KDE
Un graphique d’estimation de la densité par noyau (KDE) est une méthode permettant de visualiser la distribution des observations dans un ensemble de données, analogue à un histogramme. KDE représente les données à l’aide d’une courbe de densité de probabilité continue dans une ou plusieurs dimensions.
Par rapport à un histogramme, KDE peut produire un tracé moins encombré et plus interprétable, en particulier lors du dessin de plusieurs distributions. Mais il a le potentiel d’introduire des distorsions si la distribution sous-jacente est bornée ou non lisse.
Estimateur de densité par noyau
data = d3.range(50).map(() => jStat.normal.sample(0,1))// Create a slider for bandwidthviewof bandwidth = Inputs.range([0.02,1], {step:0.02,value:0.4,label:tex`b`,width:"600px"})// Function to calculate KDEfunctionkde(data, bandwidth) {const kernel = x =>Math.exp(-0.5* x * x) /Math.sqrt(2*Math.PI)const scale =1/ (data.length* bandwidth)return d3.range(-3,3,0.01).map(x => ({ x,y: d3.sum(data, d =>kernel((x - d) / bandwidth)) * scale }))}// Plot the KDE with variable bandwidthPlot.plot({y: {label:"Density" },x: {label:"Value" },marks: [ Plot.line(kde(data, bandwidth), {x:"x",y:"y",stroke:"red",strokeWidth:2}) ],grid:true,height:500,width:1050,style: {backgroundColor:"white" }})
References
Baker, Monya et al. 2016. “Statisticians Issue Warning on p Values.”Nature 531 (7593): 151–51.
Davidson, Russell, and James G MacKinnon. 1998. “Graphical Methods for Investigating the Size and Power of Hypothesis Tests.”The Manchester School 66 (1): 1–26.
Romer, David. 2020. “In Praise of Confidence Intervals.” In AEA Papers and Proceedings, 110:55–60. American Economic Association.
Wasserstein, Ronald L, and Nicole A Lazar. 2016. “The ASA Statement on p-Values: Context, Process, and Purpose.”The American Statistician. Taylor & Francis.