貝葉斯概率和頻率概率如何的?
貝葉斯概率和頻率概率相對,它從確定的分布中觀測到的頻率或者在樣本空間中的比例來導出概率。
采用頻率概率的統計和概率的理論由R.A. Fisher,Egon Pearson和Jerzy Neyman在20世紀上半葉發展起來。A. N. Kolmogorov也采用頻率概率來通過勒貝格積分為測度論中的概率奠定數學基礎(《概率論基礎》(1933年))。Savage, Koopman,Abraham Wald和其他一些學者自1950年以來發展了貝葉斯概率。
貝葉斯學派和頻率學派在概率解釋上的分歧在統計學實踐上有重要的結果。例如,在用同樣的數據比較兩個假設的時候,假設測試理論基于概率的頻率解釋,它允許基于錯誤推出數據更支持另外那個模型/假設的概率來否定或接受一個模型/假設(零假設)。出現這種錯誤的概率稱為一類誤差,它要求考慮從同樣的數據源導出的假想的數據集合要比實際觀測到的數據更為極端。這個方法允許論斷'或者兩個假設不同或者觀測到的數據是誤導的集合'。相對應的是,貝葉斯方法基于實際觀測到的數據,因此能夠對于任何數量的假設直接賦予后驗概率。對于代表每個假設的模型的參數必須賦予概率的要求是這種直接方法的代價。
貝葉斯概率的應用具體是怎么樣的呢?
自1950年代以來,貝葉斯理論和貝葉斯概率通過考克斯定理, Jaynes的最大熵原理以及荷蘭書論證得到了廣泛的應用。在很多應用中,貝葉斯方法更為普適,也似乎較頻率概率能得出更好的結果。貝葉斯因子也和奧卡姆剃刀一起使用。數學應用請參看貝葉斯推論和貝葉斯定理。
有些人將貝葉斯推論視為科學方法的一種應用,因為通過貝葉斯推論來更新概率要求從對于不同假設的初始信任度出發,采集新的信息(例如通過做試驗),然后根據新的信息調整原有的信念。調整原有的信念可以意味著(更加接)接受或者推翻初始的假設。
貝葉斯技術被應用于垃圾郵件的過濾上。貝葉斯垃圾郵件過濾器采用電子郵件的一個參考集合來定義什么最初被認為是垃圾郵件。定義了參考之后,過濾器使用參考中的特點來將新的郵件判定為垃圾郵件或有效郵件。新電子郵件作為新的信息出現,并且如果用戶在垃圾郵件和有效郵件的判定中發現錯誤,這個新的信息會更新初始參考集合中的信息,以期將來的判定可以更為精確。參看貝葉斯推論和貝葉斯過濾。