Funkcja gęstości prawdopodobieństwa (PDF)

Co to jest funkcja gęstości prawdopodobieństwa (PDF)?

Funkcja gęstości prawdopodobieństwa (PDF) to wyrażenie statystyczne, które definiuje rozkład prawdopodobieństwa (prawdopodobieństwo wyniku) dla zmiennej dyskretnej (np. akcji lub ETF), w przeciwieństwie do ciągłej zmiennej losowej.Różnica między dyskretną zmienną losową polega na tym, że można zidentyfikować dokładną wartość zmiennej.

Rozkład normalny jest typowym przykładem pliku PDF, tworzącego dobrze znany kształt krzywej dzwonowej.

W finansach handlowcy i inwestorzy używają plików PDF, aby zrozumieć, w jaki sposób dystrybuowane są zwroty cenowe, aby ocenić ich ryzyko i oczekiwany profil zwrotu.

Kluczowe dania na wynos

  • Funkcje gęstości prawdopodobieństwa są miarą statystyczną używaną do pomiaru prawdopodobnego wyniku wartości dyskretnej (np. ceny akcji lub funduszu ETF).
  • Pliki PDF są wykreślane na wykresie typowo przypominającym krzywą dzwonową, z prawdopodobieństwem wyników leżących poniżej krzywej.
  • Zmienna dyskretna może być dokładnie zmierzona, podczas gdy zmienna ciągła może mieć wartości nieskończone.
  • Pliki PDF mogą służyć do oceny potencjalnego ryzyka/zysku określonego papieru wartościowego lub funduszu w portfelu.
  • Często cytowany jest rozkład normalny, tworzący krzywą w kształcie dzwonu.

Zrozumienie funkcji gęstości prawdopodobieństwa (PDF)

Pliki PDF są wykorzystywane w finansach do pomiaru ryzyka określonego papieru wartościowego, takiego jak pojedyncze akcje lub fundusze ETF.

Zazwyczaj są one przedstawiane na wykresie, przy czym normalna krzywa dzwonkowa wskazuje neutralne ryzyko rynkowe, a dzwonek na każdym końcu wskazuje większe lub mniejsze ryzyko/zysk.Gdy plik PDF jest przedstawiony graficznie, obszar pod krzywą wskaże przedział, w którym będzie przypadać zmienna.Całkowity obszar w tym przedziale wykresu jest równy prawdopodobieństwu wystąpienia dyskretnej zmiennej losowej.

Dokładniej, ponieważ bezwzględne prawdopodobieństwo, że ciągła zmienna losowa przyjmie określoną wartość wynosi zero ze względu na nieskończony zestaw możliwych wartości, wartość pliku PDF może być wykorzystana do określenia prawdopodobieństwa, że ​​zmienna losowa mieści się w określonym zakresie wartości.

Zdjęcie autorstwa Julie Bang © Investopedia2020

Rozkład przechylony w prawą stronę krzywej sugeruje większą nagrodę w górę, podczas gdy rozkład przekrzywiony w lewo wskazuje na większe ryzyko w dół dla traderów.

Rozkłady prawdopodobieństwa mogą być również używane do tworzenia funkcji rozkładu skumulowanego (CDF), które sumują prawdopodobieństwo wystąpienia skumulowanych wystąpień i zawsze zaczynają się od zera i kończą na 100%.

Inwestorzy powinni używać plików PDF jako jednego z wielu narzędzi do obliczania ogólnego ryzyka/zysku w ich portfelach.

Dyskretny vs.Funkcje ciągłego rozkładu prawdopodobieństwa

Pliki PDF mogą opisywać dane dyskretne lub ciągłe.Różnica polega na tym, że zmienne dyskretne mogą przyjmować tylko określone wartości, takie jak liczby całkowite, tak lub nie, pory dnia i tak dalej.Natomiast zmienna ciągła zawiera wszystkie wartości wzdłuż krzywej, w tym bardzo małe ułamki zwykłe lub dziesiętne do teoretycznie nieskończonej liczby miejsc.

Dyskretny vs.Ciągły PDF.

Zdjęcie autorstwa Julie Bang © Investopedia2020

Obliczanie funkcji rozkładu prawdopodobieństwa

Pliki PDF często charakteryzują się średnią, odchyleniem standardowym, kurtozą i skośnością.

  • Średnia: średnia arytmetyczna
  • Odchylenie standardowe: rozproszenie danych o średniej
  • Kurtoza: opisuje „otłuszczenie” ogonów pliku PDF
  • Skośność: odnosi się do odchyleń w symetrii pliku PDF

Obliczanie pliku PDF i wykreślanie go w formie graficznej może obejmować złożone obliczenia, które wykorzystują równania różniczkowe lub rachunek całkowy.W praktyce do obliczenia funkcji rozkładu prawdopodobieństwa wymagane są kalkulatory graficzne lub pakiety oprogramowania statystycznego.

Rozkład normalny

Jako przykład, obliczenia dla PDF rozkładu normalnego są następujące:

Formuła rozkładu normalnego.

gdzie:

  • x= wartość badanej zmiennej lub danych oraz f(x) funkcja prawdopodobieństwa
  • μ = średnia
  • σ = odchylenie standardowe

Rozkład normalny ma zawsze skośność = 0 i kurtozę = 3,0.

Inne funkcje rozkładu prawdopodobieństwa

Chociaż rozkład normalny jest często najczęściej cytowanym i dobrze znanym, istnieje kilka innych plików PDF.

Jednolita dystrybucja

Najprostszym i najpopularniejszym rozkładem jest rozkład równomierny, w którym wszystkie wyniki mają równe szanse wystąpienia.Sześcioboczna kostka ma równomierny rozkład.Każdy wynik ma prawdopodobieństwo około 16,67% (1/6).

Zdjęcie autorstwa Julie Bang © Investopedia2020

Rozkład dwumianowy

Rozkład dwumianowy reprezentuje dane, które mogą przyjmować tylko jedną z dwóch wartości, takich jak rzut monetą (orzeł kontra reszka) lub wyrażenia logiczne, które przyjmują formę tak/nie, włącz/wyłącz itp.

Histogram rozkładu dwumianowego.C.K.Taylor

Rozkład lognormalny

Rozkład logarytmiczno-normalny jest ważny w finansach, ponieważ lepiej opisuje rzeczywiste zwroty z cen aktywów niż standardowy rozkład normalny.Ten plik PDF ma dodatnią (prawą) skośność i wyższą kurtozę.

Rozkład logarytmiczny.

Zdjęcie autorstwa Julie Bang © Investopedia2020

Rozkład Poissona

Rozkład Poissona to plik PDF używany do opisywania zmiennych liczbowych lub prawdopodobieństwa wystąpienia określonej liczby wystąpień.Na przykład, ile jabłek znajduje się na jabłoniach, ile pszczół żyje w ulu na przestrzeni czasu lub ile dni handlowych portfel straci 5% lub więcej.

Zdjęcie autorstwa Julie Bang © Investopedia2020

Dystrybucja wersji beta

Dystrybucja beta to ogólny typ pliku PDF, który może przybierać różne kształty i cechy, określone tylko przez dwa parametry: alfa i beta.Jest często używany w finansach do szacowania współczynników odzyskiwania obligacji lub współczynników śmiertelności w ubezpieczeniach.

Wariacje dystrybucji beta.

Przykład funkcji gęstości prawdopodobieństwa

Jako prosty przykład rozkładu prawdopodobieństwa spójrzmy na liczbę zaobserwowaną podczas rzucania dwiema standardowymi sześciościennymi kośćmi.Każda kostka ma prawdopodobieństwo 1/6 wyrzucenia dowolnej liczby, od jednej do sześciu, ale suma dwóch kostek utworzy rozkład prawdopodobieństwa przedstawiony na poniższym obrazku.

Najczęstszym wynikiem jest siedem (1+6, 6+1, 5+2, 2+5, 3+4, 4+3). Z drugiej strony, dwa i dwanaście są znacznie mniej prawdopodobne (1+1 i 6+6).

Zdjęcie autorstwa Sabriny Jiang © Investopedia2020

Co mówi nam funkcja gęstości prawdopodobieństwa (PDF)?

Funkcja gęstości prawdopodobieństwa (PDF) opisuje prawdopodobieństwo zaobserwowania jakiegoś wyniku wynikającego z procesu generowania danych.Na przykład, jak prawdopodobne jest, że uczciwa moneta wyrzuci rewers (50%). Lub rola kostka do wybicia 6 (1/6 = 16,7%). Plik PDF może nam powiedzieć, które wartości najprawdopodobniej pojawią się w porównaniu z mniej prawdopodobnymi wynikami.Zmieni się to w zależności od kształtu i cech pliku PDF.

Co to jest centralne twierdzenie graniczne (CLT) i jaki ma związek z plikami PDF?

Centralne twierdzenie graniczne (CLT) mówi, że rozkład zmiennej losowej w próbie zacznie zbliżać się do rozkładu normalnego w miarę zwiększania się wielkości próby, niezależnie od rzeczywistego kształtu rozkładu.Wiemy zatem, że rzucanie monetą jest procesem binarnym, opisanym rozkładem dwumianowym (orzeł lub reszek). Jeśli jednak weźmiemy pod uwagę kilka rzutów monetą, szanse na otrzymanie dowolnej kombinacji orłów i reszek zaczynają się różnić.Na przykład, gdybyśmy rzucili monetą dziesięć razy, prawdopodobieństwo uzyskania 5 jest najprawdopodobniej, ale trafienie dziesięciu orłów z rzędu jest niezwykle rzadkie.Wyobraź sobie 1000 rzutów monetą, a rozkład zbliża się do normalnej krzywej dzwonowej.

Czym jest plik PDF a CDF?

Funkcja gęstości prawdopodobieństwa (PDF) wyjaśnia, które wartości prawdopodobnie pojawią się w procesie generowania danych w danym momencie lub dla dowolnego losowania.

Kumulatywna funkcja dystrybucji (CDF) zamiast tego pokazuje, w jaki sposób te marginalne prawdopodobieństwa sumują się, ostatecznie osiągając 100% (lub 1,0) możliwych wyników.Używając CDF możemy zobaczyć, jak prawdopodobne jest, że wynik zmiennej będzie mniejszy lub równy pewnej przewidywanej wartości.

Poniższy rysunek przedstawia na przykład współczynnik CDF dla rozkładu normalnego.

CDF.

Zdjęcie autorstwa Julie Bang © Investopedia2020

Dolna linia

Funkcje rozkładu prawdopodobieństwa (PDF) opisują oczekiwane wartości zmiennych losowych pobranych z próby.Kształt pliku PDF wyjaśnia, jak prawdopodobne jest wystąpienie zaobserwowanej wartości.Rozkład normalny jest powszechnie używanym przykładem, który można opisać tylko jego średnią i odchyleniem standardowym.Inne pliki PDF są bardziej złożone i dopracowane.Zwroty z cen akcji mają tendencję do podążania za rozkładem log-normalnym, a nie normalnym, co wskazuje, że straty w dół są częstsze niż bardzo duże zyski w stosunku do przewidywań rozkładu normalnego.