Sandsynlighedstæthedsfunktion (PDF)

Hvad er en sandsynlighedsdensitetsfunktion (PDF)?

Sandsynlighedstæthedsfunktion (PDF) er et statistisk udtryk, der definerer en sandsynlighedsfordeling (sandsynligheden for et udfald) for en diskreterandom variabel (f.eks. en aktie eller ETF) i modsætning til en kontinuerlig tilfældig variabel.Forskellen mellem en diskret tilfældig variabel er, at du kan identificere en nøjagtig værdi af variablen.

Normalfordelingen er et almindeligt eksempel på en PDF, der danner den velkendte klokkekurveform.

Inden for finans bruger handlende og investorer PDF'er til at forstå, hvordan prisafkast fordeles for at evaluere deres risiko og forventede afkastprofil.

Nøgle takeaways

  • Sandsynlighedstæthedsfunktioner er et statistisk mål, der bruges til at måle det sandsynlige udfald af en diskret værdi (f.eks. prisen på en aktie eller ETF).
  • PDF'er er plottet på en graf, der typisk ligner en klokkekurve, med sandsynligheden for, at resultaterne ligger under kurven.
  • En diskret variabel kan måles nøjagtigt, mens en kontinuert variabel kan have uendelige værdier.
  • PDF'er kan bruges til at måle den potentielle risiko/belønning af et bestemt værdipapir eller en fond i en portefølje.
  • Normalfordelingen nævnes ofte og danner en klokkeformet kurve.

Forståelse af sandsynlighedstæthedsfunktioner (PDF'er)

PDF'er bruges i finansiering til at måle risikoen for et bestemt værdipapir, såsom en individuel aktie eller ETF.

De er typisk afbildet på en graf med en normal klokkekurve, der indikerer neutral markedsrisiko, og en klokke i hver ende, der indikerer større eller mindre risiko/belønning.Når PDF'en er grafisk portrætteret, vil området under kurven angive det interval, hvori variablen vil falde.Det samlede areal i dette interval af grafen er lig med sandsynligheden for, at en diskret stokastisk variabel forekommer.

Mere præcist, da den absolutte sandsynlighed for, at en kontinuert tilfældig variabel antager en specifik værdi er nul på grund af det uendelige sæt af mulige værdier, der er tilgængelige, kan værdien af ​​en PDF bruges til at bestemme sandsynligheden for, at en tilfældig variabel falder inden for et specifikt interval af værdier.

Billede af Julie Bang © Investopedia2020

En fordeling skævt til højre side af kurven tyder på større opadgående belønning, mens en fordeling skæv til venstre indikerer større nedadgående risiko for handlende.

Sandsynlighedsfordelinger kan også bruges til at skabe kumulative distributionsfunktioner (CDF'er), som summerer sandsynligheden for hændelser kumulativt og vil altid starte ved nul og slutte ved 100 %.

Investorer bør bruge PDF'er som et af mange værktøjer til at beregne den samlede risiko/belønning i spil i deres porteføljer.

Diskret vs.Kontinuerlige sandsynlighedsfordelingsfunktioner

PDF'er kan beskrive enten diskrete eller kontinuerlige data.Forskellen er, at diskrete variable kun kan antage specifikke værdier, såsom heltal, ja vs. nej, tidspunkter på dagen og så videre.En kontinuert variabel indeholder derimod alle værdier langs kurven, inklusive meget små brøker eller decimaler ud til et teoretisk uendeligt antal pladser.

Diskret vs.Løbende PDF.

Billede af Julie Bang © Investopedia2020

Beregning af en sandsynlighedsfordelingsfunktion

PDF-filer er ofte karakteriseret ved deres middelværdi, standardafvigelse, kurtosis og skævhed.

  • Middelværdi: den aritmetiske gennemsnitsværdi
  • Standardafvigelse: spredningen af ​​data om middelværdien
  • Kurtosis: beskriver "fedmen" af PDF'ens haler
  • Skævhed: henviser til afvigelser i PDF'ens symmetri

At beregne PDF'en og plotte den grafisk kan involvere komplekse beregninger, der bruger differentialligninger eller integralregning.I praksis kræves grafregnere eller statistiske softwarepakker for at beregne en sandsynlighedsfordelingsfunktion.

Normalfordelingen

Som et eksempel er beregningen for PDF'en af ​​normalfordelingen som følger:

Normalfordelingsformel.

hvor:

  • x= værdien af ​​den eller de data, der undersøges, og f(x) sandsynlighedsfunktionen
  • μ = middelværdien
  • σ = standardafvigelsen

En normalfordeling har altid en skævhed = 0 og kurtosis = 3,0.

Andre sandsynlighedsfordelingsfunktioner

Mens normalfordelingen ofte er den mest citerede og velkendte, findes der adskillige andre PDF'er.

Ensartet fordeling

Den enkleste og mest populære fordeling er den ensartede fordeling, hvor alle udfald har lige stor chance for at opstå.En sekssidet matrice har en ensartet fordeling.Hvert udfald har en sandsynlighed på omkring 16,67 % (1/6).

Billede af Julie Bang © Investopedia2020

Binomial fordeling

Binomialfordelingen repræsenterer data, der kun kan antage en af ​​to værdier, såsom flip af en mønt (hoveder vs. haler) eller logiske udtryk, der har form af ja/nej, tænd/sluk osv.

Et histogram af en binomial fordeling.C.K. Taylor

Lognormal fordeling

Lognormalfordelingen er vigtig i finanssektoren, fordi den bedre beskriver faktiske aktivprisafkast end standardnormalfordelingen.Denne PDF har positiv (højre) skævhed og højere kurtosis.

Lognormal fordeling.

Billede af Julie Bang © Investopedia2020

Poisson distribution

Poisson-fordelingen er en PDF, der bruges til at beskrive tællevariabler eller sandsynligheden for, at et bestemt antal forekomster vil ske.For eksempel, hvor mange æbler findes på æbletræer, hvor mange bier er der i live i en bikube over tid, eller på hvor mange handelsdage en portefølje vil miste 5 % eller mere.

Billede af Julie Bang © Investopedia2020

Beta distribution

Betadistributionen er en generel type PDF, der kan antage en række forskellige former og karakteristika, som defineret af blot to parametre: alfa og beta.Det bruges ofte i finansiering til at estimere obligationsmisligholdelsesrater eller dødelighedsrater i forsikring.

Beta distributionsvariationer.

Eksempel på en sandsynlighedstæthedsfunktion

Som et simpelt eksempel på en sandsynlighedsfordeling, lad os se på det tal, der observeres, når du kaster to standard sekssidede terninger.Hver terning har 1/6 sandsynlighed for at kaste ethvert enkelt tal, en til seks, men summen af ​​to terninger vil danne sandsynlighedsfordelingen afbildet på billedet nedenfor.

Syv er det mest almindelige udfald (1+6, 6+1, 5+2, 2+5, 3+4, 4+3). To og tolv er derimod langt mindre sandsynlige (1+1 og 6+6).

Billede af Sabrina Jiang © Investopedia2020

Hvad fortæller en sandsynlighedsdensitetsfunktion (PDF) os?

En sandsynlighedstæthedsfunktion (PDF) beskriver, hvor sandsynligt det er at observere et eller andet resultat, der er et resultat af en datagenererende proces.For eksempel, hvor sandsynligt er det, at en retfærdig mønt vendte op i hovedet (50%). Eller rollen som en terning til at komme op på 6 (1/6 = 16,7%). En PDF kan fortælle os, hvilke værdier der derfor er størst sandsynlighed for at blive vist i forhold til de mindre sandsynlige udfald.Dette vil ændre sig afhængigt af PDF'ens form og karakteristika.

Hvad er Central Limit Theorem (CLT), og hvordan er det relateret til PDF'er?

Den centrale grænsesætning (CLT) siger, at fordelingen af ​​en tilfældig variabel i en stikprøve vil begynde at nærme sig en normalfordeling, efterhånden som stikprøvestørrelsen bliver større, uanset fordelingens sande form.Således ved vi, at vende en mønt er en binær proces, beskrevet af den binomiale fordeling (hoveder eller haler). Men hvis vi overvejer flere møntkast, begynder oddsene for at få en bestemt kombination af hoveder og haler at variere.For eksempel, hvis vi skulle vende mønten ti gange, er oddset for at få 5 af hver mest sandsynligt, men at få ti hoveder i træk er ekstremt sjældent.Forestil dig 1.000 møntvendinger, og fordelingen nærmer sig den normale klokkekurve.

Hvad er en PDF vs. en CDF?

En sandsynlighedstæthedsfunktion (PDF) forklarer, hvilke værdier der sandsynligvis vises i en datagenereringsproces på et givet tidspunkt eller for en given lodtrækning.

En kumulativ distributionsfunktion (CDF) skildrer i stedet, hvordan disse marginale sandsynligheder lægger sig sammen og når i sidste ende 100 % (eller 1,0) af mulige udfald.Ved at bruge en CDF kan vi se, hvor sandsynligt det er, at en variabels udfald vil være mindre end eller lig med en forudsagt værdi.

Nedenstående figur viser for eksempel CDF for en normalfordeling.

CDF.

Billede af Julie Bang © Investopedia2020

Bundlinjen

Sandsynlighedsfordelingsfunktioner (PDF'er) beskriver de forventede værdier af tilfældige variabler udtaget fra en stikprøve.Formen af ​​PDF'en forklarer, hvor sandsynligt det er, at en observeret værdi skulle have fundet sted.Normalfordelingen er et almindeligt anvendt eksempel, der kan beskrives kun dens middelværdi og standardafvigelse.Andre PDF-filer er mere komplekse og nuancerede.Aktiekursafkast har en tendens til at følge en lognormal fordeling snarere end en normal, hvilket indikerer, at nedadgående tab er hyppigere end meget store gevinster i forhold til, hvad normalfordelingen ville forudsige.