2020年5月22日 星期五

從二項分布到 Poisson 分布 Binomial & Poisson distribution(機率簡介)

Poisson 分布

Poisson 分布適合於描述單位時間內隨機事件發生的次數的機率分布。如某一服務設施在一定時間內受到的服務請求的次數、汽車站台的候客人數、機器出現的故障數等等 [1]。

以下對於 Poisson 過程的介紹來自於翁秉仁老師的文章 [2]:
一個 Poisson 過程有三個基本特性:
  1. 在一個短時間區間\( \Delta t \)內,發生一次事件的機率與\( \Delta t \) 成正比:\( \lambda \Delta t\)。
  2. 在短時間內發生兩次以上的機率可以忽略。
  3. 在不重疊的時間段落裡,事件各自發生的次數是獨立的。

從二項分布到 Poisson 分布

Poisson 分布描述的是\( Pr(k,T)\),指的是此事件在 T 時間中發生了 k 次,並且此 k 次事件各自獨立,若把 T 時間分成 N 個小區段(\(T=N \Delta t\)): \[ Pr(k,T)\approx \frac{N!}{k!(N-k)!}(\lambda \Delta t)^k(1-\lambda \Delta t)^{N-k} \\ = \frac{N(N-1)...(N-k+1)}{k!} \cdot \lambda^k \cdot \frac{T^k}{N^k} \cdot \frac{(1-\frac{\lambda T}{N})^N}{(1-\frac{\lambda T}{N})^k} \\ = \frac{(\lambda T)^k}{k!} \cdot \frac{N(N-1)...(N-k+1)}{N^k} \cdot \frac{(1-\frac{\lambda T}{N})^N}{(1-\frac{\lambda T}{N})^k} \] 我們知道以下式子: \[ \lim_{N\rightarrow \infty }(1+\frac{\alpha}{N})^N = \lim_{N\rightarrow \infty}(1+\frac{1}{N/\alpha})^{\frac{N}{\alpha}\cdot \alpha} =e^\alpha \] 因此當N趨近於無限大時: \[ Pr(k,T)=\frac{(\lambda T)^k}{k!}e^{-\lambda T} \] 這個式子就是Poisson分布的機率質量函數,在這\(\lambda\)表示在時間區間 T 中,事件的平均發生次數: \[ Pr(X=k)=\frac{e^{-\lambda}\lambda^k}{k!} \] 因此我們可以看出二項分布跟 Poisson 分布的關係:當二項分布的 N 很大以及 p 很小的時候,此事件出現的次數可以用 Poisson 分布來逼近。

Poisson分布的最大似然估計

\[ l=ln(\prod_{i=1}^{N}(\frac{e^{-\lambda}\lambda^{k_i}}{k_i!})) = \sum_{i=1}^{N}ln(\frac{e^{-\lambda}\lambda^{k_i}}{k_i!}) \\ =-N\lambda+(\sum_{i=1}^{N}k_i)ln(\lambda)-\sum_{i=1}^{N}ln(k_i!) \] 導數為0的極值: \[ \frac{\partial l}{\partial \lambda} = N + (\sum_{i=1}^{N}k_i)\frac{1}{\lambda}=0 \] \[ \lambda_{MLE}=\frac{\sum_{i=1}^{N}k_i}{N} \]

參考資料

[1] https://zh.wikipedia.org/zh-tw/%E6%B3%8A%E6%9D%BE%E5%88%86%E4%BD%88
[2] http://episte.math.ntu.edu.tw/applications/ap_poisson/index.html

沒有留言:

張貼留言